Coefficiente di determinazione
determinare il coefficiente di determinazione per la retta di regressione delle vendite di sistemi "Home Theater" sul prezzo utilizzando le seguenti osservazioni campionarie
Vendite 420 380 350 400 440 380 450 420
Prezzo 5.5 6.0 6.5 6.0 5.0 6.5 4.5 5.0
Voglio calcolare $R^2=(SSR)/(SST)$
$\bar y= 5.63$
$\bar x= 405$
$SST=\sum(y_i-\bar y)^2=0.02$
$SSR =b_1^2\sum(x_i-\bar x)^2=0.10$ dove $b_1 =s_(xy)/(sx)^2=-0.02$
quindi $R^2=5$ dove ho sbagliato?
Vendite 420 380 350 400 440 380 450 420
Prezzo 5.5 6.0 6.5 6.0 5.0 6.5 4.5 5.0
Voglio calcolare $R^2=(SSR)/(SST)$
$\bar y= 5.63$
$\bar x= 405$
$SST=\sum(y_i-\bar y)^2=0.02$
$SSR =b_1^2\sum(x_i-\bar x)^2=0.10$ dove $b_1 =s_(xy)/(sx)^2=-0.02$
quindi $R^2=5$ dove ho sbagliato?
Risposte
"puppeteer":
dove ho sbagliato?
ad applicare le formule in modo meccanico senza averne davvero compreso il significato.
Oltretutto con quei dati il modo più semplice di calcolare il coefficiente di determinazione è tramite la sua definizione....
$R^2=(cov^2(X,Y))/(sigma_(X)^2sigma_(Y)^2)=[E(XY)-E(X)E(Y)]^2/([E(X^2)-E^2(X)][E(Y^2)-E^2(Y)])=0.878$
Si sapevo che il coeff. di determinazione è il quadrato del coeff. di correlazione e infatti in questo modo il risultato torna ,tuttavia volevo provare anche ad applicare la formula $R^2=(SSR)/(SST)$

Perdonami ma che formule hai usato per calcolare SSR,SSE,SST? e come hai calcolato Ystima?
è per quello che ho detto "usi formule senza comprenderne bene il significato"
io non uso [quasi] mai formule precotte....basta ragionare sul significato delle funzioni:
TSS è la devianza della variabile osservata (le vendite) $Sigma(y-bar(y))^2$
RSS è la devianza della retta di regressione rispetto alla media della variabile osservata $Sigma(hat(y)-bar(y))^2$
ESS è il residuo: ESS+RSS=TSS (devianza della retta rispetto ai singoli valori) $Sigma(hat(y)-y)^2$
Ystima ($hat(y)$) è la retta di regressione $Y=a+bX$
la x è il regressore e serve unicamente per determinare i parametri della retta
se sei interessato solo al calcolo del coefficiente e non dell'espressione della retta puoi inveritre tranquillamente regressore e variabile tanto non ti cambia nulla.
io non uso [quasi] mai formule precotte....basta ragionare sul significato delle funzioni:
TSS è la devianza della variabile osservata (le vendite) $Sigma(y-bar(y))^2$
RSS è la devianza della retta di regressione rispetto alla media della variabile osservata $Sigma(hat(y)-bar(y))^2$
ESS è il residuo: ESS+RSS=TSS (devianza della retta rispetto ai singoli valori) $Sigma(hat(y)-y)^2$
Ystima ($hat(y)$) è la retta di regressione $Y=a+bX$
la x è il regressore e serve unicamente per determinare i parametri della retta
se sei interessato solo al calcolo del coefficiente e non dell'espressione della retta puoi inveritre tranquillamente regressore e variabile tanto non ti cambia nulla.
in pratica il libro mi dà queste formule già 'pronte per l'uso' che vedi nel post 1 ,le prendo per buone ma non capisco perchè SSR E SST non tornino eppure i calcoli li ho fatti anche io su un foglio elettronico