Stima della varianza
Nel metodo dei minimi quadrati lineare si fa l'ipotesi che le $ y_i $ siano distribuite normalmente intorno a $ Bx_i+A $ . Supponiamo che le $ \sigma_y $ siano tutte uguali. La variabile $ y_i-Bx_i-A $ sarà centrata in 0 con larghezza $ \sigma_y $. Perchè una buona stima di $ \sigma_y $ è data da $ sqrt{sum_{k=1}^N \frac{(y_i-Bx_i-A)^2}{N-2} $ ? Nello scarto quadratico medio non si sommano i quadrati degli scarti rispetto alla media aritmetica dei valori? Nella formula al numeratore riporta solo la somma dei valori al quadrato?!? Si suppone che tale media sia dettata dal valore atteso della variabile $ y_i-Bx_i-A $ e quindi sia 0 ottenendo:$ sqrt{sum_{k=1}^N \frac{(y_i-Bx_i-A-0)^2}{N-2} $=$ sqrt{sum_{k=1}^N \frac{(y_i-Bx_i-A)^2}{N-2} $? (N-2 al denominatore mi è chiaro!)
Risposte
molto molto brevemente,
il modello lineare è del tipo
$y=a+bx+epsilon$
l'ipotesi si fa sugli errori $epsilon$ che, fra l'altro, si distribuiscono normalmente con media zero.... quindi la media di y coincide con $a+bx$
ma trovi tutto in ogni ottima dispensa sulla regressione
ciao
il modello lineare è del tipo
$y=a+bx+epsilon$
l'ipotesi si fa sugli errori $epsilon$ che, fra l'altro, si distribuiscono normalmente con media zero.... quindi la media di y coincide con $a+bx$
ma trovi tutto in ogni ottima dispensa sulla regressione
ciao
Per la prima parte ci sono. Posso scrivere $ \epsilon_i=y_i-Bx_i-A $ ed ottenere una varaiabile centrata in 0 con larghezza $ \sigma_y $. La seconda cosa che hai detto non mi è chiara: perche questa condizione implica che la media di $ y_i $ coincide con $ Bx_i+A $ ? Nella sommatoria degli scarti avrei quindi una media che dipende dall'indice i e che non è uguale per tutti gli $ y_i $ rispetto a cui scarto? Scusa ma l'unica cosa che sono riuscito a trovare sulle dispense sono trattazioni che riprendono il $ \chi^2 $. A me però interesserebbe capirlo ragionando sugli scarti! Potresti indicarmi dove vedere?
Grazie
Grazie
"TS778LB":
l'unica cosa che sono riuscito a trovare sulle dispense sono trattazioni che riprendono il $ \chi^2 $.
mi sembra davvero strano che tu debba lavorare sulle regressioni e sul libro di testo non vi sia nulla. Ad ogni modo, semplicemente digitando Regressione lineare su un qualunque motore di ricerca trovi tutto.
esempio 1
esempio 2
esempio 3
esempio 4
ecc ecc
detto in parole molto ma molto semplici e riassuntive, il tuo modello è del tipo
$y=a+bx+epsilon$
dove sugli errori $epsilon$ si fanno le seguenti ipotesi canoniche
1) gli errori sono incorrelati
2) Gli errori hanno varianza costante (omoschedasticità)
3) $epsilon_i~ N(0;sigma^2)$ (ipotesi non essenziale nel modello di regressione lineare classico ma necessaria nel caso di intervalli di confidenza e prova delle ipotesi sui parametri)[nota]assumendo la distribuzione normale dei residui l'incorrelazione equivale all'indipendenza[/nota]
Quindi il valore stimato (atteso, medio) del valore osservato sarà $hat(y)=a+bx$ che è una media, condizionata al valore del regressore X.
in definitiva la tua formula si riduce alla seguente $s=sqrt((Sigma_i epsilon_i^2)/(n-2))$ essendo ovviamente $epsilon=y-hat(y)$
saluti