A maestro Sergio
Ciao Sergio mi spieghi questo esercizio? Io nel frattempo approfondisco, ma la tua spiegazione è necessaria per poter passare avanti. Grazie mille.
Sappiamo che l’equazione della retta di regressione di y rispetto ad x, è y: 2.4 x. Sappiamo anche che il coefficiente di correlazione lineare tra le due variabili è pari ad r = 0.8 e sappiamo che la varianza dei residui è 29.16. Quanto vale la varianza di y?
A)81
B) 37
C) 10.5
D) 52
E) 96
Sappiamo che l’equazione della retta di regressione di y rispetto ad x, è y: 2.4 x. Sappiamo anche che il coefficiente di correlazione lineare tra le due variabili è pari ad r = 0.8 e sappiamo che la varianza dei residui è 29.16. Quanto vale la varianza di y?
A)81
B) 37
C) 10.5
D) 52
E) 96
Risposte
Maestro , maestro sempre e solo maestro! Mi viene la pelle d'oca; a questo punto conoscere di presenza persone come voi è un sogno! Grazie mille sei un mito! Non avete la superbia dei docenti universitari, per la carica che rivestono, e nello stesso tempo siete molto, molto, molto più competenti di loro; è questo il motivo che vi rende delle persone speciali! Io in questo periodo sto vivendo un sogno, ed a volte non ci credo proprio per questo, in quanto dialogare con voi è come, tanto per intenderci, essere in contatto con persone, irraggiungibili da questo punto di vista, come la Montalcini. Vi assicuro che proverei la stessa emozione! Spero che duri a lungo
Prima di tutto una domanda, i termini varianza residua e varianza di errore sono termini sinonimi? Per il resto, caro Sergio, io darò Statistica non certo perché ho appreso frequentando il corso. Se così fosse non mi sarei ridotto all'appello della terza sessione. E' grazie a voi che riuscirò a superare l'esame. Siete grandi in maniera assoluta, perché non ammeterete mai di esserlo. Non so se vivi un pò l'Università di oggi, ma ti posso assicurare che il personale docente è composto da tanti assistenti e ricercatori non confermati che dal punto di vista della didattica sono molto scadenti. Poi sapere le cose è un cosa, diffondere conoscenza è una cosa totalmente diversa e forse innata nelle persone; forse non esiste una scuola dove imparare come insegnare. Io l'esempio lampante c'è in famiglia, mio fratello a soli 24 anni si laurea ad ottobre in Ingegneria Biomedica (laurea specialistica) con il massimo dei voti; ma non è certo centodieci e lode per quanto riguarda le spiegazioni che mi dà, quando me le può dare, studiando a Roma lo vedo poco. Tu, Sergio, sei centodieci e lode, però oltre a questo sai (hai una cultura notevole), perciò sei il massimo. Ma non lo ammetterai mai...
In simboli le slides del prof riportano:
$sigma_epson^2$ (cioé sigma quadro epson) varianza di errore
$sigma_epson^2$ (cioé sigma quadro epson) varianza di errore
Riguardo all'esercizio, quindi, dire "quanto vale la varianza di y" e dire "determinare la varianza totale" è la stessa cosa? Inoltre, per quanto riguarda, in simboli, la varianza totale bisogna correggere e sostituire al posto della x la y? Il testo dell'esercizio mi dà l'informazione sull'equazione "y:2,4x", quest'informazione mi serve per rispondere al secondo quesito, cioè "determinare lo scarto quadratico medio di x"?
Potresti darmi la tua mail così ti faccio vedere la slide, su quel dubbio dei termini sinonimi.
Per il resto, ritorniamo sempre al discorso di prima, non è un problema di sapere o pretendere, questo credo assolutamente; è un problema di saper comunicare, di saper spiegare agli studenti, credimi i giovani dottori universitari non lo sanno fare. Io quando comunico con te o ascolto le tue spiegazioni, lo faccio con il massimo del piacere, per questi argomenti; è una sensazione che non ho provato quando si tenevano le lezioni del corso di Statistica.
Potresti darmi la tua mail così ti faccio vedere la slide, su quel dubbio dei termini sinonimi.
Per il resto, ritorniamo sempre al discorso di prima, non è un problema di sapere o pretendere, questo credo assolutamente; è un problema di saper comunicare, di saper spiegare agli studenti, credimi i giovani dottori universitari non lo sanno fare. Io quando comunico con te o ascolto le tue spiegazioni, lo faccio con il massimo del piacere, per questi argomenti; è una sensazione che non ho provato quando si tenevano le lezioni del corso di Statistica.
Non riesco a risolvere, Sergio. In particolare il dato che comprende la varianza di x e quindi lo scarto è la varianza spiegata, corretto? Il valore della varianza spiegata si può determinare, ma per calcolare lo scarto e la covarianza (richiesta nel punto successivo), anche se è molto semplice, non trovo lo spiraglio. Cosa succede se mi dai la tua mail?
Ciao. Non ho capito una cosa: nel tuo modello di regressione compare il termine costante? Mi è venuto il dubbio in quanto tu dice che la retta di regressione stimata è $y_{i}=2.4*x_{i}$. Io credo che nel modello ci sia, forse non ti è stata data perché è poco utile nei calcoli richiesti il suo valore: se però non c'è nel modello le cose cambiano.
Fammi sapere.
Fammi sapere.
Vuoi dire che manca l'intercetta ("a")? No, non c'è Olax.
Guarda a mio parere è sottointeso che ci sia in quanto le cose si complicherebbero e non ti poco. Infatti non potresti più usare la formula del primo punto
$R^{2}=1-\frac{RSS}{TSS}$
dove $RSS$ è la devianza residua e $TSS$ è la devianza totale. Infatti in questa formula tu sfrutti il fatto che la somma dei residui nel modello con intercetta è zero, mentre questo non è assolutamente vero per il modello senza intercetta.
Se hai i risultati posso vedere se è stata sottointesa o meno la costante.
Ciao
$R^{2}=1-\frac{RSS}{TSS}$
dove $RSS$ è la devianza residua e $TSS$ è la devianza totale. Infatti in questa formula tu sfrutti il fatto che la somma dei residui nel modello con intercetta è zero, mentre questo non è assolutamente vero per il modello senza intercetta.
Se hai i risultati posso vedere se è stata sottointesa o meno la costante.
Ciao
L'esercizio è:
Con riferimento all’esercizio precedente, qual è il valore dello scarto quadratico medio di x?:
A)81
B) 3
C) 18
D) 9
E) 1
F) 16
Con riferimento all’esercizio precedente, qual è il valore della covarianza tra x e y?:
A)101
B) 35
C) 21,6
D) 0.66
E) 0.03
F) -0.03
Con riferimento all’esercizio precedente, qual è il valore dello scarto quadratico medio di x?:
A)81
B) 3
C) 18
D) 9
E) 1
F) 16
Con riferimento all’esercizio precedente, qual è il valore della covarianza tra x e y?:
A)101
B) 35
C) 21,6
D) 0.66
E) 0.03
F) -0.03
Ok, supponiamo che il tuo modello abbia anche l'intercetta $a$. Il modello è dunque
$y_{i}=a+b*x_{i}+u_{i}$
La stima di $b$ è data dalla formula
$\hat{b}=\frac{cov(x,y)}{\sigma_{x}^{2}}=\frac{covarianza(x,y)}{varianza(x)}$
Il coefficiente di correlazione è dato da
$\rho_{xy}=\frac{cov(x,y)}{\sigma_{x}*\sigma_{y}}$
Dalle due formule puoi ricavare che
$\hat{b}=\frac{\rho_{xy}*\sigma_{y}}{sigma_{x}}$
quindi
$\sigma_{x}=\frac{\rho_{xy}*\sigma_{y}}{\hat{b}}$
Ora $\sigma_{x}$ è lo scarto quadratico medio, ovvero la radice positiva della varianza di x. Hai tutto per poterlo calcolare.
$y_{i}=a+b*x_{i}+u_{i}$
La stima di $b$ è data dalla formula
$\hat{b}=\frac{cov(x,y)}{\sigma_{x}^{2}}=\frac{covarianza(x,y)}{varianza(x)}$
Il coefficiente di correlazione è dato da
$\rho_{xy}=\frac{cov(x,y)}{\sigma_{x}*\sigma_{y}}$
Dalle due formule puoi ricavare che
$\hat{b}=\frac{\rho_{xy}*\sigma_{y}}{sigma_{x}}$
quindi
$\sigma_{x}=\frac{\rho_{xy}*\sigma_{y}}{\hat{b}}$
Ora $\sigma_{x}$ è lo scarto quadratico medio, ovvero la radice positiva della varianza di x. Hai tutto per poterlo calcolare.
Detto questo l'esercizio a mio parere non è fatto nel modo mogliore, in quanto per risolverlo presuppone che la varianza dei residui sia
$\frac{1}{n-1}\sum_{i=1}^{n}(y_{i}-\hat{y}_{i})^2$
In questo modo tu puoi usare la formula che ti ha dato Sergio, ovvero
$R^{2}=1-\frac{\sum_{i=1}^{n}(y_{i}-\hat{y}_{i})^2}{\sum_{i=1}^{n}(y_{i}-\bar{y})^2}=1-\frac{("varianza residui")}{("varianza totale")}$
Nella realtà lo stimatore che si usa per la varianza dei residui, in un modello con intercetta e coefficiente $b$, è
$\frac{1}{n-2}\sum_{i=1}^{n}(y_{i}-\hat{y}_{i})^2$
In questo modo lo stimatore è corretto. Questa è solo una precisazione per farti capire che spesso potrai trovare $n-2$ al denominatore invece di $n-1$.
$\frac{1}{n-1}\sum_{i=1}^{n}(y_{i}-\hat{y}_{i})^2$
In questo modo tu puoi usare la formula che ti ha dato Sergio, ovvero
$R^{2}=1-\frac{\sum_{i=1}^{n}(y_{i}-\hat{y}_{i})^2}{\sum_{i=1}^{n}(y_{i}-\bar{y})^2}=1-\frac{("varianza residui")}{("varianza totale")}$
Nella realtà lo stimatore che si usa per la varianza dei residui, in un modello con intercetta e coefficiente $b$, è
$\frac{1}{n-2}\sum_{i=1}^{n}(y_{i}-\hat{y}_{i})^2$
In questo modo lo stimatore è corretto. Questa è solo una precisazione per farti capire che spesso potrai trovare $n-2$ al denominatore invece di $n-1$.
Grazie mille campione!!!!
"Non avete la superbia dei docenti universitari"
Sottoscrivo! Molti utenti del forum sono straordinari. Qui si respira aria fresca, aria pulita (cit.: http://www.lastampa.it/_web/cmstp/tmplR ... 5&sezione=)
Sottoscrivo! Molti utenti del forum sono straordinari. Qui si respira aria fresca, aria pulita (cit.: http://www.lastampa.it/_web/cmstp/tmplR ... 5&sezione=)
Ed ora un commento serio. Nel mio post precedente l'unica cosa seria era il link a un articolo di Barbara Spinelli, straordinario, come spesso sono i suoi commenti.
Due osservazioni, per l'appunto serie.
- credo che questo forum possa vantarsi del modo in cui i contributi di polt si sono evoluti. Certo vi è una "buona predisposizione" da parte di polt, ma direi che è merito del forum (cioè, di alcuni suoi utenti, ma che non a caso bazzicano qui e non altrove) averla coltivata. E bene direi. Mi sembra evidente una crescita di polt, soprattutto nell'acquisire consapevolezza dei suoi propri mezzi, e questo è davvero importante. Unico problema è che polt sta monopolizzando questa sezione
- polt, ma ti danno sempre e solo esercizi a risposta multipla? Se così è, capisco la tua profonda insoddisfazione nei confronti dei "prof" universitari. Una disciplina scientifica ridotta a "settimana enigmistica"...
Due osservazioni, per l'appunto serie.
- credo che questo forum possa vantarsi del modo in cui i contributi di polt si sono evoluti. Certo vi è una "buona predisposizione" da parte di polt, ma direi che è merito del forum (cioè, di alcuni suoi utenti, ma che non a caso bazzicano qui e non altrove) averla coltivata. E bene direi. Mi sembra evidente una crescita di polt, soprattutto nell'acquisire consapevolezza dei suoi propri mezzi, e questo è davvero importante. Unico problema è che polt sta monopolizzando questa sezione

- polt, ma ti danno sempre e solo esercizi a risposta multipla? Se così è, capisco la tua profonda insoddisfazione nei confronti dei "prof" universitari. Una disciplina scientifica ridotta a "settimana enigmistica"...
Mi dispiace Fioravante ma purtroppo mi devo esercitare e talvolta non è facile farlo da sè. Ribadisco che la mia critica nei confronti dei docenti universitari riguarda la didattica, il modo di spiegare gli argomenti agli studenti. I veri docenti si trovano qui. Grazie mille, ciao.