Modello di regressione Normale
Riapro questa discussione perché vorrei riprendere alcuni aspetti del problema[nota][xdom="tommik"]l'argomento iniziale non aveva nulla a che fare con il modello di regressione lineare, quindi divido[/xdom][/nota].
Il modello in questione è sostanzialmente il modello di regressione Normale. Per generalità, ma praticamente senza complicare il problema sopra esposto e mantenendone i risultati, possiamo sostituire le ipotesi
$E[Y|X=x]=x$ con $E[Y|X=x]=beta_0 + beta_1 x$
$V[Y|X=x]= 2$ con $V[Y|X=x]= sigma^2$
In altri termini:
$Y = E[Y|X=x] + epsilon = beta_0 + beta_1 X + epsilon$
da cui $E[epsilon | X=x]=0$
La domanda che pongo è questa:
considerando valida l’ipotesi di omoschedasticità, cioè $V[Y|X=x]= sigma^2$
risulta per conseguenza anche valida $E[epsilon | X=x]=0$ ?
Iniziamo il ragionamento considerando che sicuramente è valida la scoposizione
$V[Y|X=x]= E[epsilon^2 |X=x] - (E[epsilon |X=x])^2 = sigma^2$
Adesso se la differenza è costante può significare solo che
1) I due termini variano entrambi con $x$ ma differiscono sempre e solo per una costante ($sigma^2$)
2) I due termini sono costanti a loro volta
la possibilità 1 mi sembra insostenibile. Facendo conto, per adesso, che sia vero resta solo la possibilità 2.
Se l'omoschedasticità implica la condizione 2 stiamo dicendo che $E[epsilon |X=x]=c$.
Ma allora siamo quasi arrivati perchè se consideriamo $beta_0$ come un parametro libero, allora sicuramente assorbirà qualunque $c!=0$. Ma allora siamo arrivati proprio a dire che, nel modello di regressione Normale, l'omoschedasticità implica $E[epsilon | X=x]=0$ , o equivalentemente $E[Y|X=x]=beta_0 + beta_1 x$.
Vi sembra ci siano problemi nel ragionamento? Compresa l'impossibilità della 1?
A me non sembra ci siano errori eppure non sono convinto del risultato ottenuto perchè nell'ntrodurre il modello di regressione l'ipotesi $E[epsilon | X=x]=0$ è sempre chiaramente addotta mentre, se mai, è quella di omoschedasticità ad essere considerata secondaria.
Il modello in questione è sostanzialmente il modello di regressione Normale. Per generalità, ma praticamente senza complicare il problema sopra esposto e mantenendone i risultati, possiamo sostituire le ipotesi
$E[Y|X=x]=x$ con $E[Y|X=x]=beta_0 + beta_1 x$
$V[Y|X=x]= 2$ con $V[Y|X=x]= sigma^2$
In altri termini:
$Y = E[Y|X=x] + epsilon = beta_0 + beta_1 X + epsilon$
da cui $E[epsilon | X=x]=0$
La domanda che pongo è questa:
considerando valida l’ipotesi di omoschedasticità, cioè $V[Y|X=x]= sigma^2$
risulta per conseguenza anche valida $E[epsilon | X=x]=0$ ?
Iniziamo il ragionamento considerando che sicuramente è valida la scoposizione
$V[Y|X=x]= E[epsilon^2 |X=x] - (E[epsilon |X=x])^2 = sigma^2$
Adesso se la differenza è costante può significare solo che
1) I due termini variano entrambi con $x$ ma differiscono sempre e solo per una costante ($sigma^2$)
2) I due termini sono costanti a loro volta
la possibilità 1 mi sembra insostenibile. Facendo conto, per adesso, che sia vero resta solo la possibilità 2.
Se l'omoschedasticità implica la condizione 2 stiamo dicendo che $E[epsilon |X=x]=c$.
Ma allora siamo quasi arrivati perchè se consideriamo $beta_0$ come un parametro libero, allora sicuramente assorbirà qualunque $c!=0$. Ma allora siamo arrivati proprio a dire che, nel modello di regressione Normale, l'omoschedasticità implica $E[epsilon | X=x]=0$ , o equivalentemente $E[Y|X=x]=beta_0 + beta_1 x$.
Vi sembra ci siano problemi nel ragionamento? Compresa l'impossibilità della 1?
A me non sembra ci siano errori eppure non sono convinto del risultato ottenuto perchè nell'ntrodurre il modello di regressione l'ipotesi $E[epsilon | X=x]=0$ è sempre chiaramente addotta mentre, se mai, è quella di omoschedasticità ad essere considerata secondaria.
Risposte
Capisco quello che dici, e che scrive Hansen.
Tuttavia nella scrittura:
$ V[Y|X=x]= E[epsilon^2 |X=x] - (E[epsilon |X=x])^2 = sigma^2 $
cosa c'è di sbagliato?
Essa discende da:
(allegerisco la notazione $X=x$)
$ V[Y|X]= V[beta_0 + beta_1 X + epsilon |X] = V[epsilon |X] = E[epsilon^2 |X] - (E[epsilon |X])^2 = sigma^2 $
la seconda uguaglianza è vera perchè $beta_0$ è una costante e $beta_1 x$ è come se lo fosse perchè $X=x$ è nota.
Tuttavia nella scrittura:
$ V[Y|X=x]= E[epsilon^2 |X=x] - (E[epsilon |X=x])^2 = sigma^2 $
cosa c'è di sbagliato?
Essa discende da:
(allegerisco la notazione $X=x$)
$ V[Y|X]= V[beta_0 + beta_1 X + epsilon |X] = V[epsilon |X] = E[epsilon^2 |X] - (E[epsilon |X])^2 = sigma^2 $
la seconda uguaglianza è vera perchè $beta_0$ è una costante e $beta_1 x$ è come se lo fosse perchè $X=x$ è nota.
Ma la domanda non è su come esprimere l'omoschedasticità piuttosto che l'eteroschedasticità. La domanda era
ed il ragionamento portava a dire di si ma la cosa mi lascia perplesso.
"markowitz":
..., possiamo sostituire le ipotesi
$ E[Y|X=x]=x $ con $ E[Y|X=x]=beta_0 + beta_1 x $
$ V[Y|X=x]= 2 $ con $ V[Y|X=x]= sigma^2 $
In altri termini:
$ Y = E[Y|X=x] + epsilon = beta_0 + beta_1 X + epsilon $
da cui $ E[epsilon | X=x]=0 $
La domanda che pongo è questa:
considerando valida l’ipotesi di omoschedasticità, cioè $ V[Y|X=x]= sigma^2 $
risulta per conseguenza anche valida $ E[epsilon | X=x]=0 $ ?
ed il ragionamento portava a dire di si ma la cosa mi lascia perplesso.
Innanzitutto grazie per i puntuali commenti.
Per il resto
Si, e se ci sentiamo di affidarci ai risultati di teoria asintotica possiamo anche mantenere lo stimatore OLS per i $beta_i$ a patto di sostituire lo stimatore classico della varianza con uno robusto all'eteroschedasticità.
Sono consapevole della necessità di avere \( E[\varepsilon|X=x]=0 \), non l'ho mai messa in discussione, ed apprezzo molto il Verbeek che è uno dei manuali che conosco meglio. Inoltre non solo deve avere media condizionale nulla ma, a partire dalle ipotesi sopra, $epsilon$ deve essere anche una v.a. Normale. Il trucchetto della tautologia è sicuramente escluso.
La domanda, almeno per adesso, è limitata al caso esposto nell'esercizio originale con una minima, ed immediata, generalizzazione nei parametri. In tale caso l'eteroschedsticità non è proprio considerata e mi chiedevo solo se l'ipotesi di esogeneità fosse in qualche modo annidata in quella di omoschedasticità. La seconda non è in discussione.
Si ma io mi chiedo il contrario. Tirando in ballo l'omoschedasticità è ancora necessario richiedere anche l'esogeneità? O essa è vera per conseguenza?
Qui entriamo nel vivo.
Quando parlavo di aspettativa condizionale costante ma non necessariamente nulla stavo solo mettendo in luce un pezzo del ragionamento, da vedere se corretto, che mi portava a dare risposta affermativa alla domanda posta inizialmente. Non c'era alcuna volontà di "ammettere" un'aspettativa condizionale costante ma non nulla per il termine d'errore, circostanza che porterebbe ad una risposta negativa alla domanda. Allora tiravo in ballo il ruolo della costante che diventa necessaria. Effettivamente questa può essere considerata un'ipotesi aggiuntiva rispetto all'omoschedasticità.
Come già concluso la costante è necessaria. Se consideriamo un modello senza costante l'ipotesi di esogeneità diventa necessaria anche in presenza di omoschedasticità.
Per quanto riguarda le generalizzazioni (intercetta variabile) ... vanno al di la della domanda iniziale.
Quello che scrivi mi sembra tutto corretto è sicuramente lo è \( \varepsilon=Y-E[Y|X=x] \). Ma non implica una risposta negativa alla domanda.
Infatti l'eteroschedasticità non la prendo in considerazione. Se l'ammettiamo, l'esogeneità sicuramente non discende per conseguenza e, quindi, diventa un'assunzione necessaria. Sono consapevole del fatto che l'eteroschedasticità sia una circostanza frequente almeno per i dati economici, la domanda è di carattere principalmente teorico. Ormai l'abbiamo capita ma la ripetiamo con parole diverse:
nella cornice ristretta di un modello del tipo $Y = beta_0 + beta_1 x + epsilon$
omoschedasticità implica esogeneità?
Sottolineando il fatto che la costante non la si può togliere, mi sembra di si.
Inoltre anche l'estensione a più regressori non crea problemi ed anche l'ipotesi di normalità, inizialmente presente, non mi sembra necessaria. Basta la finitezza dei momenti secondi.
Se quanto ho scritto è vero, anche al netto delle ultime due generalizzazioni, non mi sembra un risultato inutile perchè i modelli con omoschedasticità sono comunque considerati in letteratura e la riduzione ai minimi termini delle assunzioni è sempre desiderabile.
Detto questo, non sono ancora convinto, se qualcosa non vi convince ... per favore scrivete.
Per il resto
"Sergio":
Torniamo a \( E[\varepsilon|X=x]=0 \). È un assunto necessario per un semplice motivo: se non lo assumessi, il modello \( y=\beta_0+\beta_1x+\varepsilon \) sarebbe tautologico. Infatti per qualsiasi valore dei parametri potresti definire un vettore \( \varepsilon \) tale da rendere il modello una banale identità. È necessario imporre restrizioni su \( \varepsilon \) e la restrizione più ovvia e più usata è \( E[\varepsilon|X=x]=0 \), da cui derivi \( E[Y|X=x]=\beta_0+\beta_1 x \) (vedi Verbeek, A Guide to Modern Econometrics, John Wiley & Sons, 2008, pp. 14-15).
Al contrario, l'omoschedasticità non è affatto necessaria perché il modello abbia un senso. Se c'è eteroschedasticità cambia solo lo stimatore: da OLS a (F)GLS.
Si, e se ci sentiamo di affidarci ai risultati di teoria asintotica possiamo anche mantenere lo stimatore OLS per i $beta_i$ a patto di sostituire lo stimatore classico della varianza con uno robusto all'eteroschedasticità.
Sono consapevole della necessità di avere \( E[\varepsilon|X=x]=0 \), non l'ho mai messa in discussione, ed apprezzo molto il Verbeek che è uno dei manuali che conosco meglio. Inoltre non solo deve avere media condizionale nulla ma, a partire dalle ipotesi sopra, $epsilon$ deve essere anche una v.a. Normale. Il trucchetto della tautologia è sicuramente escluso.
La domanda, almeno per adesso, è limitata al caso esposto nell'esercizio originale con una minima, ed immediata, generalizzazione nei parametri. In tale caso l'eteroschedsticità non è proprio considerata e mi chiedevo solo se l'ipotesi di esogeneità fosse in qualche modo annidata in quella di omoschedasticità. La seconda non è in discussione.
"Sergio":
1) Puoi arrivare a \( E[\varepsilon|X=x]=0 \) dal modello, senza tirare in ballo la varianza. Nonostante questo...
Si ma io mi chiedo il contrario. Tirando in ballo l'omoschedasticità è ancora necessario richiedere anche l'esogeneità? O essa è vera per conseguenza?
"Sergio":
2) Assumi omoschedasticità e ne "derivi" che \( E[\varepsilon∣X=x] \) è costante, ma sarebbe costante anche se fosse zero, caso in cui il secondo termine della tua espressione per la varianza condizionata si annullerebbe. Quindi la varianza sarebbe a volte \( E[\varepsilon^2|X=x] \), a volte qualcosa di diverso, secondo il valore di \( E[\varepsilon∣X=x] \). In generale, una varianza che dipende dalla media. In un modello normale? Mai visto. Ma probabilmente tu intendi "costante" come la velocità della luce, non solo costante ma con un valore fissato. Quale?
Qui entriamo nel vivo.
Quando parlavo di aspettativa condizionale costante ma non necessariamente nulla stavo solo mettendo in luce un pezzo del ragionamento, da vedere se corretto, che mi portava a dare risposta affermativa alla domanda posta inizialmente. Non c'era alcuna volontà di "ammettere" un'aspettativa condizionale costante ma non nulla per il termine d'errore, circostanza che porterebbe ad una risposta negativa alla domanda. Allora tiravo in ballo il ruolo della costante che diventa necessaria. Effettivamente questa può essere considerata un'ipotesi aggiuntiva rispetto all'omoschedasticità.
"Sergio":
3) Osservi che se \( E[\varepsilon∣X=x] \) fosse costante, ma diverso da zero, "si scaricherebbe" su $ beta_0 $. Corretto (quasi, v. dopo), ma non vale in generale perché ci sono anche modelli senza intercetta (succede raramente, ma può succedere) o modelli con intercetta variabile (i modelli gerarchici). Soprattutto, se \( \varepsilon=Y-E[Y|X=x] \), allora \( E[\varepsilon|X=x]=E[Y|X=x]-E[E[Y|X=x]|X=x]=E[Y|X=x]-E[Y|X=x]=0 \), cioè \( E[\varepsilon|X=x] \) è sì una costante fissa e immutabile, ma è zero. A meno che in quello che ho appena scritto ci sia un errore.
Come già concluso la costante è necessaria. Se consideriamo un modello senza costante l'ipotesi di esogeneità diventa necessaria anche in presenza di omoschedasticità.
Per quanto riguarda le generalizzazioni (intercetta variabile) ... vanno al di la della domanda iniziale.
Quello che scrivi mi sembra tutto corretto è sicuramente lo è \( \varepsilon=Y-E[Y|X=x] \). Ma non implica una risposta negativa alla domanda.
"Sergio":
4) Non prendi in considerazione l'eteroschedasticità, ma se quello che dici fosse vero i casi sarebbero due: o anche l'eteroschedasticità implica \( E[\varepsilon|X=x] = 0 \), oppure in caso di eteroschedasticità puoi avere \( E[\varepsilon|X=x] \ne 0 \). Nel primo caso quello che affermi è comunque inutile, il secondo è assurdo.
Infatti l'eteroschedasticità non la prendo in considerazione. Se l'ammettiamo, l'esogeneità sicuramente non discende per conseguenza e, quindi, diventa un'assunzione necessaria. Sono consapevole del fatto che l'eteroschedasticità sia una circostanza frequente almeno per i dati economici, la domanda è di carattere principalmente teorico. Ormai l'abbiamo capita ma la ripetiamo con parole diverse:
nella cornice ristretta di un modello del tipo $Y = beta_0 + beta_1 x + epsilon$
omoschedasticità implica esogeneità?
Sottolineando il fatto che la costante non la si può togliere, mi sembra di si.
Inoltre anche l'estensione a più regressori non crea problemi ed anche l'ipotesi di normalità, inizialmente presente, non mi sembra necessaria. Basta la finitezza dei momenti secondi.
Se quanto ho scritto è vero, anche al netto delle ultime due generalizzazioni, non mi sembra un risultato inutile perchè i modelli con omoschedasticità sono comunque considerati in letteratura e la riduzione ai minimi termini delle assunzioni è sempre desiderabile.
Detto questo, non sono ancora convinto, se qualcosa non vi convince ... per favore scrivete.
@tommik
Lasciami solo dire che avevo riflettuto sulla possibilità di aprire un altro post ma alla fine non l'ho fatto perchè la domanda che ho posto è relativa all'omoschedasticità quindi proprio ad una varianza condizionata. Calare il problema nel caso che avevo trovato offriva interessanti collegamenti. Infatti avevo cercato nel forum argomenti già trattati che sfiorassero quello che a me adesso interessava ed avevo trovato quello in oggetto. Dire che la domanda che ho posto non aveva nulla a che fare col tema iniziale è eccessivo. Del resto i collegamenti sono un aspetto cruciale per comprendere i modelli probabilistici nel loro insieme. In definitiva la possibilità di unire o dividere gli argomenti è anche questione di dare enfasi su un aspetto o su un altro ... alla fine è anche una questione di gusti. Infatti se esiste il rischio di conflare argomenti diversi esiste anche quello di duplicarne di già trattati. Ho paura che sul forum molti utenti postino domande senza fare la minima ricerca di un tema connesso e questo produce inutili duplicazioni. Comunque se ritieni che, in questo caso, sia più opportuno dividere gli argomenti va bene. In effetti la piega che può prendere l'argomento potrebbe renderlo opportuno. All'inizio non era facile dirlo.
Ne approfitto per chiederti se esiste la possibilità di inserire "a latere" di ogni discussione i link di altre discussioni connesse. Mi sembra utile.
Tornando al problema.
Infatti lo vedo.
Quello che hai scritto è libero da "errori" ma apre la porta ad un problema ben più ampio.
Infatti c'è un aspetto logico su cui alcune alcune presentazioni sono ambigue e, tenendo conto di quanto sopra, anche quello che hai scritto tu può rientrarci.
Adesso
\( \varepsilon=Y-E[Y|X=x] \)
è da intendere come una definizione? Da quanto scrivi sembra di si. Ed in effetti possiamo vederla così ma allora come hai agevolmente dimostrato
$E[\varepsilon|X=x]=0$
è vera per costruzione. Quindi non è un'assunzione.
In questo caso la domanda che ho posto non avrebbe proprio senso. Ma, cosa ben più importante, non avrebbe neppure senso porre l'esogeneità come assunzione.
Nel mio ragionamento \[ E[\varepsilon|X=x]=0 \ \] è considerata un'assunzione ed è così in molte presentazioni, anzi in econometria è solitamente intesa come l'assunzione chiave.
In particolare, nel ragionamento proposto, ci si chiede se è un'assunzione annidata in quella di omoschedasticità. Quindi non posso "usare la (1)" come indichi nel post precedente.
Lasciami solo dire che avevo riflettuto sulla possibilità di aprire un altro post ma alla fine non l'ho fatto perchè la domanda che ho posto è relativa all'omoschedasticità quindi proprio ad una varianza condizionata. Calare il problema nel caso che avevo trovato offriva interessanti collegamenti. Infatti avevo cercato nel forum argomenti già trattati che sfiorassero quello che a me adesso interessava ed avevo trovato quello in oggetto. Dire che la domanda che ho posto non aveva nulla a che fare col tema iniziale è eccessivo. Del resto i collegamenti sono un aspetto cruciale per comprendere i modelli probabilistici nel loro insieme. In definitiva la possibilità di unire o dividere gli argomenti è anche questione di dare enfasi su un aspetto o su un altro ... alla fine è anche una questione di gusti. Infatti se esiste il rischio di conflare argomenti diversi esiste anche quello di duplicarne di già trattati. Ho paura che sul forum molti utenti postino domande senza fare la minima ricerca di un tema connesso e questo produce inutili duplicazioni. Comunque se ritieni che, in questo caso, sia più opportuno dividere gli argomenti va bene. In effetti la piega che può prendere l'argomento potrebbe renderlo opportuno. All'inizio non era facile dirlo.
Ne approfitto per chiederti se esiste la possibilità di inserire "a latere" di ogni discussione i link di altre discussioni connesse. Mi sembra utile.
Tornando al problema.
"Sergio":
È talmente semplice e chiaro che non riesco proprio a capire perché non riesci a vederlo.
Infatti lo vedo.
Quello che hai scritto è libero da "errori" ma apre la porta ad un problema ben più ampio.
Infatti c'è un aspetto logico su cui alcune alcune presentazioni sono ambigue e, tenendo conto di quanto sopra, anche quello che hai scritto tu può rientrarci.
Adesso
\( \varepsilon=Y-E[Y|X=x] \)
è da intendere come una definizione? Da quanto scrivi sembra di si. Ed in effetti possiamo vederla così ma allora come hai agevolmente dimostrato
$E[\varepsilon|X=x]=0$
è vera per costruzione. Quindi non è un'assunzione.
In questo caso la domanda che ho posto non avrebbe proprio senso. Ma, cosa ben più importante, non avrebbe neppure senso porre l'esogeneità come assunzione.
Nel mio ragionamento \[ E[\varepsilon|X=x]=0 \ \] è considerata un'assunzione ed è così in molte presentazioni, anzi in econometria è solitamente intesa come l'assunzione chiave.
In particolare, nel ragionamento proposto, ci si chiede se è un'assunzione annidata in quella di omoschedasticità. Quindi non posso "usare la (1)" come indichi nel post precedente.
"Sergio":
... ma dovunque guardi non si arriva mai a \( E[e|X=x]=0 \) assumendo omoschedasticità.
E per tutti, assolutamente tutti, \( V[Y|X=x]=E[\varepsilon^2|X=x] \) perché \( E[e|X=x]=0 \) e non viceversa.
Ed è proprio per questo che la circostanza discussa mi lasciava e mi lascia perplesso

però non mi accontento di dire: se nessuno studioso affermato lo ha scritto allora è falso.
Dopo tutto non siamo mica avvocati



"Sergio":
E infatti l'assunto (o come lo vuoi chiamare: se $ a $ implica $ b $ e viceversa, è indifferente assumere $ a $ oppure $ b $) vale anche nel caso di eteroschedasticità, ma tu ti rifiuti di tenerne conto.
Mi arrendo
Gli aspetti connessi all'eteroschedasticità non obbligano noi a non poter ragionare sotto l'ipotesi di omoschedasticità. La domanda quindi resta legittima.
Per il resto non voglio convincere ne te ne altri che la risposta alla domanda sia affermativa ... non sono sicuro neppure io

Però, salvo la necessità della costante e lasciando fuori generalizzazioni varie, non ho trovato, neanche qui, il modo di dimostrare che la risposta alla domanda sia negativa.
Forse si tratta solo di un nesso tra assunzioni ... secondario quindi tralasciato ... forse no.
D'altra parte possiamo ragionare sull'assurdità stessa della domanda considerando l'esogeneità come vera a prescindere ... ma questo ci può portare lontano e non è esattamente quello che avevo in mente.
Comunque non voglio tediare ne te ne altri. Se non vi sembra ci siano altre cose interessanti da dire, in primis correzioni, possiamo chiudere.
Diciamo più che altro che, ancora non sono convinto del fatto che alla domanda si debba dare risposta negativa. Mi sembra invece positiva. Peraltro la domanda ha origine nel modello di regressione normale ma i passaggi visti sopra non implicano, almeno apparentemente, il vincolo di distribuzione normale multivariata per la coppia $(X,Y)$. Sembra proprio bastare la finitezza dei primi due momenti.
Già solo a partire da questo l'affermazione che metti in corsivo
non mi sembra sufficiente per concludere che, in generale, la risposta alla domanda sia negativa per conseguenza.
Peraltro anche limitatamente al caso di distribuzione normale l'affermazione mi sembra un po generica e può essere facilmente fraintesa.
Se capisco bene cosa intendi vuoi sottolineare il fatto che la distribuzione Normale è definita da due parametri che, in questo caso specifico, coincidono proprio con media e varianza. Adesso i parametri, costanti, sono per definizione indipendenti e quindi anche media e varianza sono indipendenti. Nel caso multivariato si aggiunge il parametro di correlazione ma l'estensione rimane valida. Per altre distribuzioni come ad esempio l'esponenziale non sarebbe vero, infatti una modifica dell'unico parametro agisce sia sulla media che sulla varianza.
E' questo che intendi? Se intendi altro spiegami.
Tuttavia il discorso sopra non è vero per le medie condizionali che invece, in generale, dipendono anche dalle varianze delle variabili rispetto cui si condiziona. Peraltro proprio quest'ultimo è il contesto della regressione. Per questo, proprio qui, è facile fraintendere.
Inoltre quando più sopra hai parlato di eteroschedasticità l'hai espressa nella forma $sigma^2(x)$ ma anche, proprio, la media condizionale di $y$ dipende da $x$; quindi non sono indipendenti. Questo rende l'affermazione ancora più fraintendibile. Non so come tu voglia spenderla per dimostrare la necessità di una risposta negativa alla domanda.
Già solo a partire da questo l'affermazione che metti in corsivo
"Sergio":
in un modello normale non c'è alcuna relazione tra media e varianza, puoi avere infinite varianze per ciascuna media, puoi avere infinite medie per ciascuna varianza.
non mi sembra sufficiente per concludere che, in generale, la risposta alla domanda sia negativa per conseguenza.
Peraltro anche limitatamente al caso di distribuzione normale l'affermazione mi sembra un po generica e può essere facilmente fraintesa.
Se capisco bene cosa intendi vuoi sottolineare il fatto che la distribuzione Normale è definita da due parametri che, in questo caso specifico, coincidono proprio con media e varianza. Adesso i parametri, costanti, sono per definizione indipendenti e quindi anche media e varianza sono indipendenti. Nel caso multivariato si aggiunge il parametro di correlazione ma l'estensione rimane valida. Per altre distribuzioni come ad esempio l'esponenziale non sarebbe vero, infatti una modifica dell'unico parametro agisce sia sulla media che sulla varianza.
E' questo che intendi? Se intendi altro spiegami.
Tuttavia il discorso sopra non è vero per le medie condizionali che invece, in generale, dipendono anche dalle varianze delle variabili rispetto cui si condiziona. Peraltro proprio quest'ultimo è il contesto della regressione. Per questo, proprio qui, è facile fraintendere.
Inoltre quando più sopra hai parlato di eteroschedasticità l'hai espressa nella forma $sigma^2(x)$ ma anche, proprio, la media condizionale di $y$ dipende da $x$; quindi non sono indipendenti. Questo rende l'affermazione ancora più fraintendibile. Non so come tu voglia spenderla per dimostrare la necessità di una risposta negativa alla domanda.
Non capisco il tono sarcastico della tua risposta. E non è la prima volta che leggo risposte del genere. Capirai che me ne frega di "aver ragione" e meno ancora di venir qui a fare il fenomeno. Si sta solo facendo un ragionamento tra gente che invece di fare altro passa parte del tempo libero a ragionare su ste cose. Secondo alcuni siamo solo dei coglioni. Se riusciamo a venir qui per litigare ... hanno ragione loro.
Comunque proviamo a continuare la discussione.
Si l'eteroschedasticità non la voglio considerare e basta leggere la domanda per capire che è ovvio.
Considerare altre distribuzioni non è che "mi fa comodo" è un fatto che discende naturalmente dai passaggi sopra ed ho già detto perchè è così. Peraltro se la condizione (omoschedasticità implica esogeneità) vale più in generale vale anche per la Normale quindi possiamo anche limitarci a questa. Se mai è a te che "fa comodo" estendere ad altri concetti per sviare una domanda in cui non sarebbero coinvolti.
Davvero?
Ti do un consiglio: riparti dal via.
[/quote]
Si dico davvero. Ma siccome mi sbaglio non sto a spiegare nulla. Invece tu che sai come procedere, invece di fare il fenomeno hai solo da spiegarti. Ti ricordo che non è una discussione privata e magari a qualcuno la spiegazione interessa.
Qui almeno una spiegazione provi a darla
Problema: ci sono infiniti vettori $ x $ che possono avere la stessa media, pur avendo varianze diverse. E viceversa.
Ti do un consiglio: riparti dal via.
[/quote]
Ed allora? Il punto è che l'$x$ che osservo, lo stesso numero, influisce sia sulla media che sulla varianza condizionale che, quindi, non sono due v.a. indipendenti.
Infine lo chiarisco, e non è il primo post in cui lo faccio, tutto quello che ho detto, ma proprio dall'inizio, può essere sbagliato. Chi la pensa così ha solo da spiegare perchè. Poi sarebbe anche buono che desse la spiegazione corretta, magari a qualcuno interessa.
Comunque proviamo a continuare la discussione.
"Sergio":
Quindi ti rifiuti di considerare l'eteroschedasticità, vuoi limitarti all'omoschedasticità, ma ora vuoi estendere il discorso ad altre distribuzioni perché... ti fa comodo![]()
Si l'eteroschedasticità non la voglio considerare e basta leggere la domanda per capire che è ovvio.
Considerare altre distribuzioni non è che "mi fa comodo" è un fatto che discende naturalmente dai passaggi sopra ed ho già detto perchè è così. Peraltro se la condizione (omoschedasticità implica esogeneità) vale più in generale vale anche per la Normale quindi possiamo anche limitarci a questa. Se mai è a te che "fa comodo" estendere ad altri concetti per sviare una domanda in cui non sarebbero coinvolti.
"Sergio":
[quote="markowitz"]Tuttavia il discorso sopra non è vero per le medie condizionali che invece, in generale, dipendono anche dalle varianze delle variabili rispetto cui si condiziona.
Davvero?
Ti do un consiglio: riparti dal via.
[/quote]
Si dico davvero. Ma siccome mi sbaglio non sto a spiegare nulla. Invece tu che sai come procedere, invece di fare il fenomeno hai solo da spiegarti. Ti ricordo che non è una discussione privata e magari a qualcuno la spiegazione interessa.
Qui almeno una spiegazione provi a darla
"Sergio":
[quote="markowitz"]Inoltre quando più sopra hai parlato di eteroschedasticità l'hai espressa nella forma $ \sigma^2(x) $ ma anche, proprio, la media condizionale di $ y $ dipende da $ x $; quindi non sono indipendenti.
Problema: ci sono infiniti vettori $ x $ che possono avere la stessa media, pur avendo varianze diverse. E viceversa.
Ti do un consiglio: riparti dal via.
[/quote]
Ed allora? Il punto è che l'$x$ che osservo, lo stesso numero, influisce sia sulla media che sulla varianza condizionale che, quindi, non sono due v.a. indipendenti.
Infine lo chiarisco, e non è il primo post in cui lo faccio, tutto quello che ho detto, ma proprio dall'inizio, può essere sbagliato. Chi la pensa così ha solo da spiegare perchè. Poi sarebbe anche buono che desse la spiegazione corretta, magari a qualcuno interessa.
Bravo, mi hai letto nel pensiero.
Riassumo la questione e ne metto in chiaro le patologie a beneficio di chi ci legge. Soprattutto dei lettori più disarmati che invece di chiarisi le idee potrebbero confondersele.
Quello di cui parlo e chiaro dal primo post, ed anche reltivamente semplice. Nelle prime risposte andavamo bene ... poi Sergio è partito per la tangente.
Il tema più o meno è quello, anche se pure qui il sarcasmo non manca ... ma lasciamo perdere. Non ha nessuna importanza chi abbia posto la domanda per la prima volta e dove; per la cronaca non sono io e non è questo il luogo. Quando mi ci sono confrontato per la prima volta mi suonava strano perchè non l'ho mai letto, e di materiale ne ho visto, eppure sono argomenti molto trattati. D'altra parte non è scritto neppure il contrario, e neppure è lasciato chiaramente intendere. Quello che gli autori "sognano" non lo so. E' una domanda legittima. Peraltro a mia opinione e per farla breve, tenuto a bada il tono, tutte le domande lo sono.
Pensavo l'errorre dovesse emergere subito, invece no. Per questo sono rimasto perplesso e per questo ho postato la domanda qui sperando che qualcuno avesse qualcosa di intelligente da dire.
Le cose che hai scritto le conosco bene e non rispondono alla domanda. Tenuto presente che assunzioni e definizioni non sono la stessa cosa, tu sostanzialmente hai usato \( E(e|x)=0 \) ed hai mostrato un paio di uguaglianze ben note. Nessuno dice che hai fatto male, ma non hai fatto altro. Non hai mostrato da dove "nasce" \( E(e|x)=0 \) e neppure a cosa serve. D'altra parte io non l'ho chiesto. So entrambe le cose, che sono fin troppo documentate. Tuttavia se \( E(e|x)=0 \) è presa come assunzione è perchè può essere violata. L'argomento è se sotto omoschedasticità possa essere comunque violata. Nulla di quello che hai scritto, nonostante le "acrobazie", dimostra che non sia vero. Naturalmente questo non dimostra che sia vero, per me è ancora un tema aperto.
Se l'ipotesi è vera, nessuna implicazione è prevista per il caso di eteroschedasticità che troppe volte hai richiamato portando la discussione dove non doveva andare. La condizione \( E(e|x)=0 \) è sempre necessaria, a prascindere da un'assunzione diretta o indotta sulla stessa. O per essere più precisi non ci siamo mai mossi dal contesto in cui sia così.
Se, all'inizio, con con eteroschedasticità e generalizzazioni sulla costante stavi già andando fuori tema, dopo hai proprio iniziato a partire per la tangente. L'affermazione sopra è vera, come anche altre, e, nella loro generalità, non le ho mai negate. Il problema è che decontestualizzate servono a poco e possono anche essere fuorvianti. Se vuoi usarle per dimostrare la falsità dell'ipotesi iniziale è inutile che "butti la palla fuori", devi restare ai passaggi che ho mostrato nel primo post e, qualunque ragionamento che proponi, deve portare a concludere l'erratezza, nello specifico, di uno di quei passaggi. Risultato, guarda caso, a cui mai sei arrivato.
Riguardo all'esempio che hai mostrato sopra siamo già ampiamente fuori tema ma merita un commento. Seguendoti nel ragionamento ho affermato che, nel contesto di un modello normale che tu hai richiamato, $E[Y|X]$ e $V[Y|X]$, non si possono considerare, in generale, v.a. indipendenti. Questo può portare a fraintendere la frase che avevi scritto in corsivo. Tu hai protestato dicendo senza mezzi termini che sono incompetente. L'esempio che hai fatto doveva dimostrare che, invece, sono indipendenti. Non è quello che hai fatto e sei nuovamente partito ancora più per la tangente prendendo v.a. non normali, chiamando con lo stesso nome ($Y$) due v.a. diverse ed hai mostrato un risultato che è lungi dal dimostrare un'indipendenza stocastica. Se non è far confusione questo...
Ma dulcis in fundo ...
Sempre con argomento l'indipendenza di cui sopra:
introduci concetti di stima che mai erano stati inseriti nel ragionamento
addirittura vai a proporre un'analogia con funzioni deterministiche che dovrebbe dimostrare che la mancata indipendenza stocastica di cui parlavo sopra è falsa
Poi mi attribuisci una frase ipergenerale che non ho mai detto e che non c'entra nulla con la mia ... ed a partire da questo dici che le sparo grosse.
Se questo non è buttarla in caciara ... è una delle strategie preferite dai politici ma a volte anche gli studiosi, volontariamente o meno, ci finiscono. Inizialmente va bene, ma qui ci sei finito volontariamente.
Un piccolo commento finale generale, sempre a beneficio di chi legge.
Le buone risposte partono, se mai, da domande confuse ... chiariscono i punti chiave ... fanno discendere la risposta in modo più o meno lungo ma che in modo sempre più mirato fanno emergere in modo quasi naturale la conclusione. E Sergio di risposte così ne ha date molte nel forum, ben più di me.
Qui abbiamo una domanda chiara e relativamente semplice e una risposta che ... nel tentativo di difendere una certa conclusione ... va in mille direzioni ma non la dimostra mai, anzi vi si allontana.
Sergio, inventati cosa vuoi ma resta sul tema.
Se qualcuno vuole portare avanti la discussione riportandola da dove è partita e portando argomenti ben posti, continuo. Altrimenti, nonostante in questa fase siamo tutti forzatamente a casa, il tempo libero lo dedico ad altro.
Quello di cui parlo e chiaro dal primo post, ed anche reltivamente semplice. Nelle prime risposte andavamo bene ... poi Sergio è partito per la tangente.
"Sergio":
Hai esordito dicendo che ti sembrava strano quello che avevi ipotizzato, perché nessuno si è mai sognato di sostenerlo. Sembrava volessi un aiuto a capire come mai nessuno pensi che l'esogeneità derivi dall'omoschedasticità.
Sembrava
Il tema più o meno è quello, anche se pure qui il sarcasmo non manca ... ma lasciamo perdere. Non ha nessuna importanza chi abbia posto la domanda per la prima volta e dove; per la cronaca non sono io e non è questo il luogo. Quando mi ci sono confrontato per la prima volta mi suonava strano perchè non l'ho mai letto, e di materiale ne ho visto, eppure sono argomenti molto trattati. D'altra parte non è scritto neppure il contrario, e neppure è lasciato chiaramente intendere. Quello che gli autori "sognano" non lo so. E' una domanda legittima. Peraltro a mia opinione e per farla breve, tenuto a bada il tono, tutte le domande lo sono.
Pensavo l'errorre dovesse emergere subito, invece no. Per questo sono rimasto perplesso e per questo ho postato la domanda qui sperando che qualcuno avesse qualcosa di intelligente da dire.
"Sergio":
Ho cercato di farti vedere che l'assunto \( E(e|x)=0 \) nasce da considerazioni che non hanno nulla a che vedere con la varianza: \( E(e|x)=0 \Leftrightarrow E(y|x)=x\beta \).
Ho cercato di farti vedere che al più si può sostenere che la definizione di \( V(y|x) \) dipende da quell'assunto, non certo viceversa.
Le cose che hai scritto le conosco bene e non rispondono alla domanda. Tenuto presente che assunzioni e definizioni non sono la stessa cosa, tu sostanzialmente hai usato \( E(e|x)=0 \) ed hai mostrato un paio di uguaglianze ben note. Nessuno dice che hai fatto male, ma non hai fatto altro. Non hai mostrato da dove "nasce" \( E(e|x)=0 \) e neppure a cosa serve. D'altra parte io non l'ho chiesto. So entrambe le cose, che sono fin troppo documentate. Tuttavia se \( E(e|x)=0 \) è presa come assunzione è perchè può essere violata. L'argomento è se sotto omoschedasticità possa essere comunque violata. Nulla di quello che hai scritto, nonostante le "acrobazie", dimostra che non sia vero. Naturalmente questo non dimostra che sia vero, per me è ancora un tema aperto.
"Sergio":
Ho cercato di proporti di considerare l'eteroschedasticità, perché se fosse vero quello che hai ipotizzato rimarrebbe da spiegare come mai l'assunto \( E(e|x)=0 \) si mantiene anche quando si esclude l'omoschedasticità.
Se l'ipotesi è vera, nessuna implicazione è prevista per il caso di eteroschedasticità che troppe volte hai richiamato portando la discussione dove non doveva andare. La condizione \( E(e|x)=0 \) è sempre necessaria, a prascindere da un'assunzione diretta o indotta sulla stessa. O per essere più precisi non ci siamo mai mossi dal contesto in cui sia così.
"Sergio":
Ho cercato di farti considerare che puoi avere infinite medie per la stessa varianza e viceversa.
Non so più che inventarmi.
Se, all'inizio, con con eteroschedasticità e generalizzazioni sulla costante stavi già andando fuori tema, dopo hai proprio iniziato a partire per la tangente. L'affermazione sopra è vera, come anche altre, e, nella loro generalità, non le ho mai negate. Il problema è che decontestualizzate servono a poco e possono anche essere fuorvianti. Se vuoi usarle per dimostrare la falsità dell'ipotesi iniziale è inutile che "butti la palla fuori", devi restare ai passaggi che ho mostrato nel primo post e, qualunque ragionamento che proponi, deve portare a concludere l'erratezza, nello specifico, di uno di quei passaggi. Risultato, guarda caso, a cui mai sei arrivato.
Riguardo all'esempio che hai mostrato sopra siamo già ampiamente fuori tema ma merita un commento. Seguendoti nel ragionamento ho affermato che, nel contesto di un modello normale che tu hai richiamato, $E[Y|X]$ e $V[Y|X]$, non si possono considerare, in generale, v.a. indipendenti. Questo può portare a fraintendere la frase che avevi scritto in corsivo. Tu hai protestato dicendo senza mezzi termini che sono incompetente. L'esempio che hai fatto doveva dimostrare che, invece, sono indipendenti. Non è quello che hai fatto e sei nuovamente partito ancora più per la tangente prendendo v.a. non normali, chiamando con lo stesso nome ($Y$) due v.a. diverse ed hai mostrato un risultato che è lungi dal dimostrare un'indipendenza stocastica. Se non è far confusione questo...
Ma dulcis in fundo ...
"Sergio":
L'$ x $ che osservi entra in gioco quando devi stimare i parametri del modello. Il modello in sé non ha nulla di osservato, quando definisci il modello i valori osservati possono essere qualsiasi.
Stai praticamente dicendo che \( \log(x) \) dipende da \( \sin(x)\rvert_{x>0} \) perché dato un $ x>0 $ sono dati anche il suo logaritmo e il suo seno. Stai praticamente dicendo che, dato $ x=3 $, se il seno è $ 0.1411 $ allora il logaritmo è $ 1.0986 $, quindi la funzione logaritmo dipende dalla funzione seno.
Stai dicendo che due variabili aleatorie (che sono funzioni) sono dipendenti se hanno lo stesso domino.
Ma ti rendi conto di quanto l'hai sparata grossa?
Sempre con argomento l'indipendenza di cui sopra:
introduci concetti di stima che mai erano stati inseriti nel ragionamento

addirittura vai a proporre un'analogia con funzioni deterministiche che dovrebbe dimostrare che la mancata indipendenza stocastica di cui parlavo sopra è falsa


Poi mi attribuisci una frase ipergenerale che non ho mai detto e che non c'entra nulla con la mia ... ed a partire da questo dici che le sparo grosse.

Se questo non è buttarla in caciara ... è una delle strategie preferite dai politici ma a volte anche gli studiosi, volontariamente o meno, ci finiscono. Inizialmente va bene, ma qui ci sei finito volontariamente.
Un piccolo commento finale generale, sempre a beneficio di chi legge.
Le buone risposte partono, se mai, da domande confuse ... chiariscono i punti chiave ... fanno discendere la risposta in modo più o meno lungo ma che in modo sempre più mirato fanno emergere in modo quasi naturale la conclusione. E Sergio di risposte così ne ha date molte nel forum, ben più di me.
Qui abbiamo una domanda chiara e relativamente semplice e una risposta che ... nel tentativo di difendere una certa conclusione ... va in mille direzioni ma non la dimostra mai, anzi vi si allontana.
Sergio, inventati cosa vuoi ma resta sul tema.
Se qualcuno vuole portare avanti la discussione riportandola da dove è partita e portando argomenti ben posti, continuo. Altrimenti, nonostante in questa fase siamo tutti forzatamente a casa, il tempo libero lo dedico ad altro.
[ot]Premesso che della discussione non ho capito nulla
, le affermazioni seguenti (ripetute) però mi hanno "intrigato" un pochino
Allora pongo questa domanda:
Le due funzioni $log$ e $sin$ sono indipendenti? Mi viene spontaneo dire di sì, che cosa centro il logaritmo di un numero con il seno dello stesso? Ma, d'altra parte, nel momento in cui ho il valore di un logaritmo possa sempre risalire al numero che lo ha "generato" e conseguentemente calcolarne poi il seno.
Di fatto, le due funzioni sono legate.
O no?
Che ne pensate? Vale la pena aprire un thread apposito?[/ot]
Cordialmente, Alex


"Sergio":è un errore clamoroso, … [/quote]
… la tua affermazione:
[quote="markowitz"]Ed allora? Il punto è che l'x che osservo, lo stesso numero, influisce sia sulla media che sulla varianza condizionale che, quindi, non sono due v.a. indipendenti.
Allora pongo questa domanda:
Le due funzioni $log$ e $sin$ sono indipendenti? Mi viene spontaneo dire di sì, che cosa centro il logaritmo di un numero con il seno dello stesso? Ma, d'altra parte, nel momento in cui ho il valore di un logaritmo possa sempre risalire al numero che lo ha "generato" e conseguentemente calcolarne poi il seno.
Di fatto, le due funzioni sono legate.
O no?

Che ne pensate? Vale la pena aprire un thread apposito?[/ot]
Cordialmente, Alex
[ot]Sì, ci avevo pensato ma la questione cambia di poco, il legame diventa più lasco ma c'è sempre.
E comunque basta cambiare esempio come $log$ e $arctan$ con dominio $(0, infty)$.
Riflettendoci un attimo, potrei dire che tutte le funzioni monotone crescenti (con lo stesso dominio) sono "dipendenti", legate
Forse ho capito dove vado a sbattere: isomorfismi e compagnia bella cioè topologia …
[/ot]
E comunque basta cambiare esempio come $log$ e $arctan$ con dominio $(0, infty)$.
Riflettendoci un attimo, potrei dire che tutte le funzioni monotone crescenti (con lo stesso dominio) sono "dipendenti", legate

Forse ho capito dove vado a sbattere: isomorfismi e compagnia bella cioè topologia …


[ot]
Ah!
[/ot]
Cordialmente, Alex
"Sergio":
… le monotone crescenti (o decrescenti, o l'una crescente e l'altra decrescente) in termini probabilistici sono correlate, quindi dipendenti. …
Ah!

Cordialmente, Alex
Come mai questo post IMMESSO mesi fa risulta immesso un quarto d'ora fa?
Non c'è nessun segno di "bump" e comunque, nel caso, non l'ho "bumpato" io ...
Misteri ...
Non c'è nessun segno di "bump" e comunque, nel caso, non l'ho "bumpato" io ...
Misteri ...
Ho "bumpato" io per sbaglio, forse il fatto è quello. Stavo girando nel forum ed ho visto che il mio ultimo messaggio in questa discussione è stato rimosso e non so perchè.

Avevi insultato qualcuno? 
Ho pensato al bump ma credevo potesse farlo solo l'autore dell'ultimo messaggio e comunque non c'era il solito messaggio "ultimo bump ..."
Misteri ...

Ho pensato al bump ma credevo potesse farlo solo l'autore dell'ultimo messaggio e comunque non c'era il solito messaggio "ultimo bump ..."
Misteri ...