Dubbio sul significato di coefficiente di correlazione

Marco Beta2
Buona domenica a tutti... studiando la matrice di covarianza ho un problema con il coefficiente di correlazione e spero in un vostro che come sempre è provvidenziale...
Sul blocco appunti fornito dal professore leggo:
"...i termini sulla diagonale principale coincidono con le varianze delle signole v.a. mentre quelle sulla diagonale secondaria possono essere espressi attraverso il coefficiente di correlazione $rho= (E[(X_1 - mu_1)(X_2-mu_2)])/(sigma_1 sigma_2)$"

Il mio dubbio è, se la matrice di covarianza è formata da tutte covarianze tranne sulla diagonale principale dove sono presenti solo varianze, allora il coefficiente di correlazione varrà sugli elementi della diagonale secondaria come anche per tutti gli altri tranne quelli della diagonale principale. Sbaglio? Cioè dovrebbe valere:

$rho= (E[(X_1 - mu_1)(X_2-mu_2)])/(sigma_1 sigma_2)$ come anche $rho= (E[(X_1 - mu_1)(X_3-mu_3)])/(sigma_1 sigma_3)$

secondo me quel "...diagonale secondaria" trae in inganno o è un errore.

Vi ringrazio in anticipo per l'aiuto :smt023

Risposte
Lo_zio_Tom
la matrice di var-covar, normalmente indicata con $Sigma$ è la matrice di TUTTE covarianze. Ciò implica che sulla diagonale principale vi siano in realtà Varianze, essendo $cov(X,X)=var(X)$

Se la vedi così non sbagli più....varianze sulla diagonale principale e covarianze nei due triangoli superiore ed inferiore.....

La stessa matrice di covarianze può essere rappresentata come matrice di correlazione, con tutti 1 sulla diag principale e tutti i $rho_((i,j))$ al di fuori di essa...

Ovviamente le covarianze possono essere espresse in funzione di $rho$

"Marco Beta2":

Sul blocco appunti fornito dal professore leggo:
"Se la matrice è $2xx2$...i termini sulla diagonale principale coincidono con le varianze delle signole v.a. mentre quelle sulla diagonale secondaria possono essere espressi attraverso il coefficiente di correlazione


(così va meglio :wink: )

Marco Beta2
"tommik":

Se la vedi così non sbagli più....varianze sulla diagonale principale e covarianze nei due triangoli superiore ed inferiore.....


Grandissimo tommik, provvidenziale come sempre :-D questa parte che ho quotato era quella che speravo di leggere, molto più chiara e precisa.
Grazie mille :smt023

MatteBalda98
Non so cosa il tuo professore volesse dire ma le cose stanno cosi. La matrice di covarianze e' una matrice simmetrica, lungo la diagonale sono presenti tutte le varianze. Se non ti e' chiaro questo dimmelo, comunque per il resto in tutta la matrice ci sono covarianze tra i vari elementi, che misurano la distanza tra tali. La correlazione e' tutt altra cosa, misura se c'è una dipendenza tra due variabili. Nella matrice di correlazione, la diagonale e' di tutti 1!! Ogni variabile ha correlazione con se stessa massima. Per il resto funziona come la matrice di covarianze, ovvero ti da relazione per ogni variabile

Marco Beta2
"tommik":
(così va meglio :wink: )


si, quello stavo notando, che lui è partito da una matrice con n v.a. per introdurre il concetto generale per poi come solito cambiare rotta ed ha analizzato una 2x2 dove in quel caso il concetto ritorna, nel senso che la diagonale principale ha tutte varianze, quella secondaria tutte covarianze, cosa non vera per una 3x3 ad esempio dove il concetto corretto è quello dato da te
:wink:

Marco Beta2
"MatteBalda98":
...

Grazie mille :smt023

Marco Beta2
Ragazzi visto che ci troviamo vi chiedo un altro favore, oltre al fatto che è compreso tra $(-1, 1)$, ci sono altre info degne di nota a riguardo?

Lo_zio_Tom
"MatteBalda98":
...per il resto in tutta la matrice ci sono covarianze tra i vari elementi, che misurano la distanza tra tali. La correlazione e' tutt altra cosa, misura se c'è una dipendenza tra due variabili.


ma per favore....

covarianza e coefficiente di correlazione lineare sono ESATTAMENTE la stessa misura di dipendenza lineare. La covarianza è un indice assoluto e quindi di difficile interpretazione; essendo però $|Cov(X,Y)|<=sigma_X sigma_Y$ allora si è definita una misura "relativa", cioè appunto il coefficiente

$rho_(X,Y)=(Cov(X,Y))/(sigma_X sigma_Y)$

in questo modo abbiamo anche una misura % della dipendenza LINEARE fra le variabili....ma concettualmente covarianza o coefficiente di correlazione sono la stessa cosa.

PS: la correlazione invece (che nessuno tranne te ha tirato in ballo in questo thread), è definita come $"Corr"=mathbb{E}[XY]$ come puoi notare da un ottimo testo di statistica come il "Gelli"

(click)


Rispondere a studenti in difficoltà è una cosa che può essere utile, ma rispondere in modo approssimativo ed errato crea confusione in chi legge.

grazie per l'attenzione

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.