Regressione lineare
Chiedo scusa per l'ennesima domanda ma in un altro esercizio sbaglio a trovare R2 ma non so il motivo.


Non capisco perchè usando formule diverse ottengo R2 differenti. Ho sbagliato a trovare a,b?
Grazie ancora


Non capisco perchè usando formule diverse ottengo R2 differenti. Ho sbagliato a trovare a,b?
Grazie ancora
Risposte
ok, visto che nessuno risponde ecco la mia risposta.
$a$ e $b$ sono corretti. Il valore di $R^2=4/9~~0.44$ è più facilmente calcolabile con la formula
$R^2=(Cov^2(X,Y))/(V(X)V(Y))=(6.4-2*3)^2/(0.6*0.6)=(4/6)^2=4/9$
Qui il problema è un po' più articolato del tuo precedente post; se vuoi impostare un foglio excel con i dati conviene fare così (dubito però che ad un esame tu possa fare così, secondo me conviene utilizzare la formula con la covarianza). In pratica ho registrato una riga per ogni singola componente bivariata (ogni casellina della tabella del testo, avendo l'accortezza di mettere le X già linearizzate)....tanto il contributo delle singole componenti alla varianza totale del fenomeno non cambia, è solo una diversa partizione dello spazio campionario.

Come puoi vedere si può calcolare l'indice di bontà della regressione con la strada che preferisci, non cambia nulla
$("Varianza Spiegata")/("Varianza Totale")=(0.267)/(0.6)~~0.44$ oppure
$1-("Varianza Residua")/("Varianza Totale")=1-(0.333)/(0.6)~~0.44$
Se non ti tornano i conti devi controllare di aver scomposto per bene la varianza totale. Deve valere sempre la seguente identità fondamentale
a me torna, viene
Inoltre giova notare che, in questo esempio, una volta capito che il parametro dell'intercetta è zero, il modello di regressione si semplifica diventando del tipo
e quindi calcolando analiticamente il parametro della retta con il metodo dei minimi quadrati ottieni
$min epsilon'epsilon=min[sum_i(y_i-z_ib)^2]$
$d/(db)[sum_i(y_i-z_ib)^2]=-2sum_i(y_i-z_ib)z_i$
poniamo uguale a zero ottenendo
$hat(b)=(sum_iz_iy_i)/(sum_iz_i^2)=(6.4)/(9.6)=2/3$
e quindi abbiamo trovato una formula "ridotta" per la stima del coefficiente di regressione.....(bella e dimostrata, da tenere nella cassetta degli attrezzi in caso di necessità
)
$a$ e $b$ sono corretti. Il valore di $R^2=4/9~~0.44$ è più facilmente calcolabile con la formula
$R^2=(Cov^2(X,Y))/(V(X)V(Y))=(6.4-2*3)^2/(0.6*0.6)=(4/6)^2=4/9$
Qui il problema è un po' più articolato del tuo precedente post; se vuoi impostare un foglio excel con i dati conviene fare così (dubito però che ad un esame tu possa fare così, secondo me conviene utilizzare la formula con la covarianza). In pratica ho registrato una riga per ogni singola componente bivariata (ogni casellina della tabella del testo, avendo l'accortezza di mettere le X già linearizzate)....tanto il contributo delle singole componenti alla varianza totale del fenomeno non cambia, è solo una diversa partizione dello spazio campionario.

Come puoi vedere si può calcolare l'indice di bontà della regressione con la strada che preferisci, non cambia nulla
$("Varianza Spiegata")/("Varianza Totale")=(0.267)/(0.6)~~0.44$ oppure
$1-("Varianza Residua")/("Varianza Totale")=1-(0.333)/(0.6)~~0.44$
Se non ti tornano i conti devi controllare di aver scomposto per bene la varianza totale. Deve valere sempre la seguente identità fondamentale
$"Varianza Totale"="Varianza Spiegata"+ "Varianza Residua"$
a me torna, viene
$0.600=0.267+0.333$
Inoltre giova notare che, in questo esempio, una volta capito che il parametro dell'intercetta è zero, il modello di regressione si semplifica diventando del tipo
$Y=Zb+epsilon$
e quindi calcolando analiticamente il parametro della retta con il metodo dei minimi quadrati ottieni
$min epsilon'epsilon=min[sum_i(y_i-z_ib)^2]$
$d/(db)[sum_i(y_i-z_ib)^2]=-2sum_i(y_i-z_ib)z_i$
poniamo uguale a zero ottenendo
$hat(b)=(sum_iz_iy_i)/(sum_iz_i^2)=(6.4)/(9.6)=2/3$
e quindi abbiamo trovato una formula "ridotta" per la stima del coefficiente di regressione.....(bella e dimostrata, da tenere nella cassetta degli attrezzi in caso di necessità

Grazie mille, sei stato gentilissimo.