Regressione
nel caso di un modello generatore di dati del tipo
$Yt= \beta_0 + \beta_1X_t + epsilon_t$
nel caso della stima del modello con omissione del regressore $\beta_0$ (regressore senza variabile collegata, è solo una costante) lo stimatore di $\beta_1$ (collegato invece alla variabile $X_t$) risulta distorto?
cioè senza $\beta_0$, $E(\beta_1)=\beta_1$ ?
non so se mi spiego.
$Yt= \beta_0 + \beta_1X_t + epsilon_t$
nel caso della stima del modello con omissione del regressore $\beta_0$ (regressore senza variabile collegata, è solo una costante) lo stimatore di $\beta_1$ (collegato invece alla variabile $X_t$) risulta distorto?
cioè senza $\beta_0$, $E(\beta_1)=\beta_1$ ?
non so se mi spiego.
Risposte
Lo stimatore è corretto, non ci sono problemi (anche nel caso avessi regressori temporali non stazionari, lì lo stimatore sarebbe asintoticamente corretto). Solitamente si lascia quasi sempre la costante in modo da poter utilizzare l'$R^{2}$ in quanto senza la costante non è più vero che la somma dei residui è zero.
perchè un quesito dell'esame richiede di valutare la distorsione dello stimatore $\beta_1$ nel caso di omissione della costante dal modello. cambiando l'espressione per la stima del parametro pensavo fosse distorto ma i calcoli mi davano uno stimatore non distorto. ti ringrazio!
Nel caso in cui $beta_0!=0$ siete sicuri che la sua omissione non provochi la distorsione della stima OLS di $beta_1$?
Se considero un modello di regressione multipla, scritto in forma matriciale, in cui non compare la costante ovvero
$Y=\beta X + u$
dove u è una v.a di media zero. Lo stimatore OLS è
$\hat{\beta}=(X^{'}X)^{-1}X^{'}Y=\beta+(X^{'}X)^{-1}X^{'}u$
quindi
$E(\hat{\beta})=\beta+(X^{'}X)^{-1}X^{'}E(u)=\beta$
Questo vale sia se nel modello sia presente la costante sia che sia assente. Nell'esempio ho preso dati cross section.
$Y=\beta X + u$
dove u è una v.a di media zero. Lo stimatore OLS è
$\hat{\beta}=(X^{'}X)^{-1}X^{'}Y=\beta+(X^{'}X)^{-1}X^{'}u$
quindi
$E(\hat{\beta})=\beta+(X^{'}X)^{-1}X^{'}E(u)=\beta$
Questo vale sia se nel modello sia presente la costante sia che sia assente. Nell'esempio ho preso dati cross section.
sono riuscito ad ottenere la risposta al quesito d'esame e risulta distorto anche se non mi sembra corretta tale soluzione
$E(\beta_1) = E ((\sum x_t Y_t) / (\sum x^2_t)) $
$= E ((\sum x_t ( \beta_0 + \beta_1 + epsilon_t)) / (\sum x^2_t)) $
$=( \beta_0 \sum E(x_t) + \beta_1 \sum E (x^2_t) + \sum E(xt \epsilon_t)) / (\sum x^2_t) $
$= \beta_1 + (beta_0 \sum E(x_t)) / (\sum x^2_t) != \beta_1 $
ciò che non mi è chiaro è che per semplificare $ (\beta_1 \sum E (x^2_t)) / (\sum x^2_t)$ in $\beta_1 $ è necessario che l'operatore $E$ sia esterno cioè $ (\beta_1 E \sum x^2_t) / (\sum x^2_t)$
perchè se non ricordo male $ E (x^2_t) = \sigma^2 + \mu^2 $
quindi se lasciassimo esterno $E$ anche nel caso di $( \beta_0 E \sum (x_t))/ (\sum x^2_t) $ avremo $ \beta_0 * 0$ quindi il termine di errore non esisterebbe
se qualcuno di voi ne sa più di me lo invito a rispondere. grazie!
$E(\beta_1) = E ((\sum x_t Y_t) / (\sum x^2_t)) $
$= E ((\sum x_t ( \beta_0 + \beta_1 + epsilon_t)) / (\sum x^2_t)) $
$=( \beta_0 \sum E(x_t) + \beta_1 \sum E (x^2_t) + \sum E(xt \epsilon_t)) / (\sum x^2_t) $
$= \beta_1 + (beta_0 \sum E(x_t)) / (\sum x^2_t) != \beta_1 $
ciò che non mi è chiaro è che per semplificare $ (\beta_1 \sum E (x^2_t)) / (\sum x^2_t)$ in $\beta_1 $ è necessario che l'operatore $E$ sia esterno cioè $ (\beta_1 E \sum x^2_t) / (\sum x^2_t)$
perchè se non ricordo male $ E (x^2_t) = \sigma^2 + \mu^2 $
quindi se lasciassimo esterno $E$ anche nel caso di $( \beta_0 E \sum (x_t))/ (\sum x^2_t) $ avremo $ \beta_0 * 0$ quindi il termine di errore non esisterebbe
se qualcuno di voi ne sa più di me lo invito a rispondere. grazie!
Scusa, ma non ho ben chiara una cosa. Nel modello devi partire con la costante o senza? Se parti da un modello di regressione senza costante, lo stimatore risulta comunque corretto: mi sembra che nella dimostrazione che ho fornito non ci sia niente di errato. Però sono curioso di sapere bene la traccia del testo ed è anche possibile che stia commettendo delle sviste.
il testo è:
si supponga che i dati in $Y_t$ siano generati in base al modello $Y_t= \beta_0 + \beta_1x_t + epsilon_t$ con $epsilon$ white noise
si dimostri che lo stimatore $\beta_1$ definito da $ (\sum x_ty_t)/(\sum x^2)$ è distorto per il parametro $\beta_1$
si supponga che i dati in $Y_t$ siano generati in base al modello $Y_t= \beta_0 + \beta_1x_t + epsilon_t$ con $epsilon$ white noise
si dimostri che lo stimatore $\beta_1$ definito da $ (\sum x_ty_t)/(\sum x^2)$ è distorto per il parametro $\beta_1$
"enrico89m":
quindi se lasciassimo esterno $E$ anche nel caso di $( \beta_0 E \sum (x_t))/ (\sum x^2_t) $ avremo $ \beta_0 * 0$ quindi il termine di errore non esisterebbe
se qualcuno di voi ne sa più di me lo invito a rispondere. grazie!
A prescindere dal discorso sui valori attesi al massimi ti verrebbe fuori $ \beta_0 * 1$ quindi distorsione.
$\beta_1$ è moltiplicato per la variabile $x_t$ che mi sono dimenticato di scrivere quando ho inserito il modello generatore dei dati in $Y_t$,
da li poi discende che $ (\beta_1 \sum x_t x_t)/(\sum x^2_t) = (beta_1 \sum x^2_t)/(\sum x^2_t) = \beta_1 *1 $
lo sommatoria ovviamente è per t che va da 1 a n sempre.
da li poi discende che $ (\beta_1 \sum x_t x_t)/(\sum x^2_t) = (beta_1 \sum x^2_t)/(\sum x^2_t) = \beta_1 *1 $
lo sommatoria ovviamente è per t che va da 1 a n sempre.
Forse non mi sono spiegato,
mi ero accorto della dimenticanza, ma non importa.
Ti rimane $beta_1$ più qualcosa, quindi distorsione
mi ero accorto della dimenticanza, ma non importa.
Ti rimane $beta_1$ più qualcosa, quindi distorsione
"markowitz":
[quote="enrico89m"]
quindi se lasciassimo esterno $E$ anche nel caso di $( \beta_0 E \sum (x_t))/ (\sum x^2_t) $ avremo $ \beta_0 * 0$ quindi il termine di errore non esisterebbe
se qualcuno di voi ne sa più di me lo invito a rispondere. grazie!
A prescindere dal discorso sui valori attesi al massimi ti verrebbe fuori $ \beta_0 * 1$ quindi distorsione.[/quote]
$ (\sum x) / (\sum x^2) $ non da $1$ ma $0$, è questo il problema non capisco perchè debba dare $0$ (è scritto nel libro ma non ci sono spiegazioni),
mentre nei calcoli fatti dal prof non tiene conto di quella semplificazione e segue il calcolo che ho riportato sopra.
Il fatto è che lo stimatore che avete scritto non è lo stimatore dei minimi quadrati se $sumx_i!=0$
"DajeForte":
Il fatto è che lo stimatore che avete scritto non è lo stimatore dei minimi quadrati se $sumx_i!=0$
perdonami ma non ti seguo.
lo stimatore è
$(Cov(X,Y))/(V[X])=(nsumx_iy_i-sumx_isumy_,)/(nsumx_i^2-(sumx_i)^2)$
è ovvio che se poni $sumx_i=0$ hai lo stimatore che avevi scritto.
$(Cov(X,Y))/(V[X])=(nsumx_iy_i-sumx_isumy_,)/(nsumx_i^2-(sumx_i)^2)$
è ovvio che se poni $sumx_i=0$ hai lo stimatore che avevi scritto.
"DajeForte":
lo stimatore è
$(Cov(X,Y))/(V[X])=(nsumx_iy_i-sumx_isumy_,)/(nsumx_i^2-(sumx_i)^2)$
è ovvio che se poni $sumx_i=0$ hai lo stimatore che avevi scritto.
io so che questo rapporto da 0 $( \sum x_t)/ (\sum x^2_t) $;
NON SOLO questo $ \ sum x_t$
"enrico89m":
io so che questo rapporto da 0 $( \sum x_t)/ (\sum x^2_t) $;
In generale questo non è vero, fa 0 se $sumx_i=0$
[
Allora vediamo di risolvere una volta per tutte questo esercizio che poi è abbastanza semplice.
L'ultima equazione che hai scritto non ha senso perché il valore atteso di una costante è ovviamente se stessa
a sinistra dell'uguale volevi mettere lo stimatore.
Al mio esame di Econometria I un simile errore del cavolo costava caro.
Esame a parte, se è solo dimenticanza fa niente, se altro (e spesso è cosi), hai parecchio da studiare.
Detto questo tu stimi
$y_t=b*x_t+epsilon_t$
in generale lo stimatore OLS dei parametri $b$ è questo
$b=(X'X)^(-1)X'y$ che sarebbe poi un sistema di equazioni scritte in forma compatta.
nel caso univariato (cioè il tuo), il sistema si riduce ad un'equazione.
$b=(X'X)^(-1)X'y=(sum x_t*y_t)/(sum x_t^2)$
per verificare le proprietà in sostanza sostituisci le sommatorie con i valori attesi
(non il valore atteso del rapporto ma il rapporto dei valori attesi che non è affatto la stessa cosa)
$b=(sum x_t*y_t)/(sum x_t^2)=(E(x_t*y_t))/(E(x_t^2))$
poi i passaggi sono più o meno quelli già visti, ma occhio ad inserire i parametri del MODELLO VERO!
il significato è fondamentale dal punto di vista delle proprietà statistiche!
$(E(x_t*y_t))/(E(x_t^2))=(E(x_t*(beta_0+beta_1x_t+epsilon_t)))/(E(x_t^2))=$
$=(E(beta_0x_t+beta_1x_t^2+x_tepsilon_t))/(E(x_t^2))=$
$=(beta_0E(x_t)+beta_1E(x_t^2)+E(x_tepsilon_t))/(E(x_t^2))=$
l'ultimo termine se ne va per assunzione(*) e rimane
$E(b)=beta_1+beta_0(E(x_t))/(E(x_t^2))!=beta_1$
quindi distorsione. Fine dell'esercizio.
Il segno della distorsione dipende da quello di $beta_0$ (che non è nullo per costruzione)
e da quello di $E(x_t)$; solo nel caso assolutamente particolare di annullamento di questo
valore atteso la stima torna non distorta.
Per avere stime non distorte si deve usare il modello bivariato che fornisce
le famosissime due equazioni normali di cui una è quella scritta da DajeForte.
spero sia tutto chiaro.
(*) a ben vedere avrei dovuto dare un nome diverso al residuo di stima la cui proprietà di esogeneità
sarebbe da discutere. In generale togliendo un regressore "vero" l'esogeneità è persa ma siccome
quella tolta è la costante, è mantenuta. altrimenti anche il terzo termine rimane tra i piedi.
"enrico89m":
nel caso di un modello generatore di dati del tipo
$Yt= \beta_0 + \beta_1X_t + epsilon_t$
nel caso della stima del modello con omissione del regressore $\beta_0$ (regressore senza variabile collegata, è solo una costante) lo stimatore di $\beta_1$ (collegato invece alla variabile $X_t$) risulta distorto?
cioè senza $\beta_0$, $E(\beta_1)=\beta_1$ ?
L'ultima equazione che hai scritto non ha senso perché il valore atteso di una costante è ovviamente se stessa
a sinistra dell'uguale volevi mettere lo stimatore.
Al mio esame di Econometria I un simile errore del cavolo costava caro.
Esame a parte, se è solo dimenticanza fa niente, se altro (e spesso è cosi), hai parecchio da studiare.
Detto questo tu stimi
$y_t=b*x_t+epsilon_t$
in generale lo stimatore OLS dei parametri $b$ è questo
$b=(X'X)^(-1)X'y$ che sarebbe poi un sistema di equazioni scritte in forma compatta.
nel caso univariato (cioè il tuo), il sistema si riduce ad un'equazione.
$b=(X'X)^(-1)X'y=(sum x_t*y_t)/(sum x_t^2)$
per verificare le proprietà in sostanza sostituisci le sommatorie con i valori attesi
(non il valore atteso del rapporto ma il rapporto dei valori attesi che non è affatto la stessa cosa)
$b=(sum x_t*y_t)/(sum x_t^2)=(E(x_t*y_t))/(E(x_t^2))$
poi i passaggi sono più o meno quelli già visti, ma occhio ad inserire i parametri del MODELLO VERO!
il significato è fondamentale dal punto di vista delle proprietà statistiche!
$(E(x_t*y_t))/(E(x_t^2))=(E(x_t*(beta_0+beta_1x_t+epsilon_t)))/(E(x_t^2))=$
$=(E(beta_0x_t+beta_1x_t^2+x_tepsilon_t))/(E(x_t^2))=$
$=(beta_0E(x_t)+beta_1E(x_t^2)+E(x_tepsilon_t))/(E(x_t^2))=$
l'ultimo termine se ne va per assunzione(*) e rimane
$E(b)=beta_1+beta_0(E(x_t))/(E(x_t^2))!=beta_1$
quindi distorsione. Fine dell'esercizio.
Il segno della distorsione dipende da quello di $beta_0$ (che non è nullo per costruzione)
e da quello di $E(x_t)$; solo nel caso assolutamente particolare di annullamento di questo
valore atteso la stima torna non distorta.
Per avere stime non distorte si deve usare il modello bivariato che fornisce
le famosissime due equazioni normali di cui una è quella scritta da DajeForte.
spero sia tutto chiaro.
(*) a ben vedere avrei dovuto dare un nome diverso al residuo di stima la cui proprietà di esogeneità
sarebbe da discutere. In generale togliendo un regressore "vero" l'esogeneità è persa ma siccome
quella tolta è la costante, è mantenuta. altrimenti anche il terzo termine rimane tra i piedi.
Ma il modello è questo:
o
quello che haiutilizzato quando hai sostituito y?
"markowitz":
$y_t=b*x_t+epsilon_t$
o
"markowitz":
$(E(x_t*y_t))/(E(x_t^2))=(E(x_t*(beta_0+beta_1x_t+epsilon_t)))/(E(x_t^2))=$
quello che haiutilizzato quando hai sostituito y?
grazie per la spiegazione! io pensavo che fosse un errore dell'esercitatore perchè il libro di econometria riportava $ \beta_1 $ come NON DISTORTO, con le assunzioni che abbiamo fatto (cioè modello teorico $ Y_t= \beta_0 + \beta_1x_t + \epsilon_t$ inserito nello stimatore di $(\sum x_tY_T)/(\sum x^2_t) $)! questo mi porta ad avere dei dubbi.
"DajeForte":
Ma il modello è questo: [quote="markowitz"]$y_t=b*x_t+epsilon_t$
o
"markowitz":
$(E(x_t*y_t))/(E(x_t^2))=(E(x_t*(beta_0+beta_1x_t+epsilon_t)))/(E(x_t^2))=$
quello che haiutilizzato quando hai sostituito y?[/quote]
Il bivariato è quello VERO, l'univariato è quello STIMATO!
bisogna sempre tener presente questo doppio aspetto in Econometria.