Matrice di covarianza
Ciao a tutti....ho questo esercizio ma nn so come costruire la matrice di covarianza...
DESCRIVERE COME VIENE REALIZZATO UN ESPERIMENTO DAL QUALE, TRAMITE I RISULTATI, SI CALCOLA LA MATRICE DI COVARIANZA E SPIEGARE IL SIGNIFICATO DEI TERMINI CHE COSTITUISCONO LA MATRICE.
Grazie
DESCRIVERE COME VIENE REALIZZATO UN ESPERIMENTO DAL QUALE, TRAMITE I RISULTATI, SI CALCOLA LA MATRICE DI COVARIANZA E SPIEGARE IL SIGNIFICATO DEI TERMINI CHE COSTITUISCONO LA MATRICE.
Grazie

Risposte
Per esempio uno misura 5 variabili su un campione di N persone :
età, altezza, peso, distanza dall'ospedale più vicino, sigarette fumate ogni giorno
A questo punto avrai una tabella del tipo (ammettiamo che siano 160 le persone intervistate):
___ Età Altezza Peso Distanza Sigarette
1) 49 172 87 3,6 30
2) 35 182 78 0,7 0
..........................................................
160) 27 168 82 11,4 12
Bene, sai calcolare la media campionaria di ognuna delle 5 suddette variabili?
Se sì, sai anche calcolare 1 160 scarti rispetto alla rispettiva media per ciascuna variabile?
E sai calcolare la deviazione standard per ognuna delle 5 variabili?
Se sai fare queste tre cose, allora possiamo andare avanti ....
Alla prossima!
età, altezza, peso, distanza dall'ospedale più vicino, sigarette fumate ogni giorno
A questo punto avrai una tabella del tipo (ammettiamo che siano 160 le persone intervistate):
___ Età Altezza Peso Distanza Sigarette
1) 49 172 87 3,6 30
2) 35 182 78 0,7 0
..........................................................
160) 27 168 82 11,4 12
Bene, sai calcolare la media campionaria di ognuna delle 5 suddette variabili?
Se sì, sai anche calcolare 1 160 scarti rispetto alla rispettiva media per ciascuna variabile?
E sai calcolare la deviazione standard per ognuna delle 5 variabili?
Se sai fare queste tre cose, allora possiamo andare avanti ....
Alla prossima!
Penso di saperle calcolare....ti scrivo le formule che conosco:
media campionaria $\eta=\sum_{i=1}^N x_i/N$
lo scarto $d=x_i-\eta$
deviazione standard $\sigma=(1/(n-1))*sqrt(\sum_{i=1}^n(x_i-\eta)^2)$
Grazie per l'aiuto....aspetto la tua risposta! Ciao
media campionaria $\eta=\sum_{i=1}^N x_i/N$
lo scarto $d=x_i-\eta$
deviazione standard $\sigma=(1/(n-1))*sqrt(\sum_{i=1}^n(x_i-\eta)^2)$
Grazie per l'aiuto....aspetto la tua risposta! Ciao
Allora ecco la formula per calcolare ogni generico elemento della matrice di covarianza.
Intanto sulla diagonale principale devi scrivere le 5 varianze, una per ciascuna variabile.
Suppongo che hai calcolato anche le 5 medie per ognuna delle variabili in gioco, e siano $\eta_k$ con k=1,2,3,4,5.
Bene, ora prendi una coppia qualsiasi di variabili fra le tue 5 (se sono 5, hai 10 modi di farlo).
Chiamiamo per semplicità X e Y le due variabili che hai scelto (per es. peso e altezza) e indichiamo le due rispettive medie con $\eta_x$ e $\eta_y$.
Allora la covarianza relativa a queste due variabili, calcolata su un campione di N osservazioni, è definita così:
$cov(X,Y) -= 1/N\sum_{j=1}^N(x_j-\eta_x)(y_j-\eta_y)$
Quindi ora hai un po' di calcoli da fare ...
Ogni volta, fatta la sommatoria di prodotti incrociati di scarti, otterrai un numero che andrai a scrivere nel posto corrispondente della matrice di varianze e covarianze. Quando l'avrai fatto per tutte le possibili coppie, avrai riempito la tua matrice, Nota che la tua matrice è simmetrica, quindi se hai riempito l'elemento (1,2) lo stesso valore andrà scritto al posto (2,1).
Concludo ricordandoti il significato di una covarianza campionaria fra due var. X e Y.
La covarianza è un numero che, se è positivo, ti dice che, quando X sale sopra la propria media, anche Y tende a fare la stessa cosa (in un certo senso tendono a variare all'unisono); quando invece la covarianza è negativa, essa ti sta dicendo che X e Y di norma variano in direzioni opposte, cioè quando X va sopra la propria media, Y tende invece a scendere sotto la propria. Infine se la covarianza fra X e Y è zero, allora le due variabili X e Y se ne vanno su e giù ognuna per cazzi suoi, senza fregarsene un picchio di quello che succede all'altra (tecnicamente si dice che in tal caso X e Y sono statisticamente scorrelate). Chiaro?
Intanto sulla diagonale principale devi scrivere le 5 varianze, una per ciascuna variabile.
Suppongo che hai calcolato anche le 5 medie per ognuna delle variabili in gioco, e siano $\eta_k$ con k=1,2,3,4,5.
Bene, ora prendi una coppia qualsiasi di variabili fra le tue 5 (se sono 5, hai 10 modi di farlo).
Chiamiamo per semplicità X e Y le due variabili che hai scelto (per es. peso e altezza) e indichiamo le due rispettive medie con $\eta_x$ e $\eta_y$.
Allora la covarianza relativa a queste due variabili, calcolata su un campione di N osservazioni, è definita così:
$cov(X,Y) -= 1/N\sum_{j=1}^N(x_j-\eta_x)(y_j-\eta_y)$
Quindi ora hai un po' di calcoli da fare ...
Ogni volta, fatta la sommatoria di prodotti incrociati di scarti, otterrai un numero che andrai a scrivere nel posto corrispondente della matrice di varianze e covarianze. Quando l'avrai fatto per tutte le possibili coppie, avrai riempito la tua matrice, Nota che la tua matrice è simmetrica, quindi se hai riempito l'elemento (1,2) lo stesso valore andrà scritto al posto (2,1).
Concludo ricordandoti il significato di una covarianza campionaria fra due var. X e Y.
La covarianza è un numero che, se è positivo, ti dice che, quando X sale sopra la propria media, anche Y tende a fare la stessa cosa (in un certo senso tendono a variare all'unisono); quando invece la covarianza è negativa, essa ti sta dicendo che X e Y di norma variano in direzioni opposte, cioè quando X va sopra la propria media, Y tende invece a scendere sotto la propria. Infine se la covarianza fra X e Y è zero, allora le due variabili X e Y se ne vanno su e giù ognuna per cazzi suoi, senza fregarsene un picchio di quello che succede all'altra (tecnicamente si dice che in tal caso X e Y sono statisticamente scorrelate). Chiaro?
Un momento! Nella tua formula per la dev. standard ho visto un errore!
La definizione corretta porta il fattore $1/(n-1)$ sotto la radice e non fuori.
Invece la varianza (che è il quadrato della dev. standard) è definita come:
$sigma^2-=1/(N-1)\sum_{k=1}^N(x_k-eta)^2$
Sta sempre in campana coi radicali ...
se no Pannella e la Bonino ti s'inchiappettano in men che non si dica!
La definizione corretta porta il fattore $1/(n-1)$ sotto la radice e non fuori.
Invece la varianza (che è il quadrato della dev. standard) è definita come:
$sigma^2-=1/(N-1)\sum_{k=1}^N(x_k-eta)^2$
Sta sempre in campana coi radicali ...
se no Pannella e la Bonino ti s'inchiappettano in men che non si dica!

