Correlazione negativa p=-1

viri1
Buonasera a tutti,
Volevo chiedervi un aiuto per un problema che mi sta sfasciando la testa :?
Ho una tabella doppia entrata(y,x) di grandezza 3x3.

Questa tabella è già rielaborata e la soluzione al problema mi dice che "nella tabella è riportata una delle possibili distribuzioni che verificano la condizione di perfetto legame lineare (si è scelto di rappresentare il caso di correlazione negativa p=-1)".

Mi son messo a fare i calcoli per prova.
La formula di p è questa(correggetemi se sbaglio):
$ rho= (sigma_xy) / (sigma_x*sigma_y) $
___
Ho calcolato la covarianza(il numeratore)facendo: (1x5x40+2x3x60+3x1x40)/140 - media X(3)*media Y(2)= -1,142857143
___
Lo scarto quadratico medio di x mi è venuto: 1,142857143 (l'ho calcolato come differenza tra momenti)
$ (1^2*40+3^2*60+5^2*40)/140 - 3^2 $

dove $ 3^2 = mu^2 $
___
Mentre lo scarto quadratico medio di y (con lo stesso procedimento) mi è venuto:0,285714286

Il problema è che non riesco a capire come faccia a venire -1 ( a me viene -3,5)
Mi potete spiegare dove sbaglio?

Risposte
viri1
nessuno mi può aiutare?

top secret
Purtroppo non sono molto bravo, studio statistica da pochi giorni... ma ho provato a farlo e vorrei aiutarti per quello che posso....

allora.. a me le medie di x e di y vengono 46,7 ciascuna dato che hanno gli stessi valori e sono da dividere entrambe per 3
( le tre entrate )

la varianza mi viene 9,43 per entrambi (sempre perchè sono 3 valori uguali) ...
facendo la sommatoria dei [(valori-media)^2] / 3 .... tutto sotto radice...

la covarianza io la calcolo come la radice quadrata del prodotto delle varianza... facendo così viene.... prova e fammi sapere...
scusa l'imprecisione ma non sono tanto pratico..

viri1
Ciao, innanzitutto grazie per la risposta.
Sono riuscito a risolvere il problema (non so dove io sbagliassi,penso qualche elevamento al quadrato).
E ora tutti i risultati tornano :)

Quello che ti posso dire è che le medie non sono calcolate come fai tu.
Non puoi fare diviso 3, ma devi "pesare" ogni valore per la sua frequenza.

Così per esempio, per trovare la media di $y$ (i cui valori sono $1$,$2$,$3$) devi fare così:

$ (1*40+2*60+3*40)/140=2$

dove $ 1 $ è $ y_1 $ e $40$ è la frequenza totale associata a $ y_1 $ (per capirci: moltiplichi, riga per riga, la prima colonna GIALLA pel'ultima colonna a destra-quella in grassetto- e poi dividi il tutto per N=$140$ che è appunto il totale delle frequenze).
Quindi la media di $y$ è $2$

Ti metto la soluzione anche della media di $x$ se vuoi provare a farla:


Edit2: ti metto anche gli altri risultati:

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.