Problema di statistica
Ciao a tutti
rieccomi qui con i miei dubbi matematici... grazie a chiunque mi seguirà nei miei ragionamenti malati...
allora, ho questo problema di statistica:
si pongono a confronto due varietà di meloni misurando la caratteristica della dolcezza con un particolare strumento ottenendo i valori riportati in tabella. dopo aver calcolato la media e la devianza standard, dire quale delle due varietà presenta maggiore variabilità.
verificare con un livello di significatività x=0,05 se le produzioni sono confrontabili, ovvero se rispetto al paramentro considerato i meloni provengono dalla stessa popolazione
X 25,12 17,25 26,42 16,80 22,15 15,92
Y 28,05 28,05 33,20 31,68 25,90 27,58
allora, ho calcolato la media, quindi ho sommato i numeri e diviso per n
la media di X è 20,61 mentre la media di Y è 29,08.
poi per calcolare la devianza devo passareprima dalla varianza, quindi ho calcolato ogni elemento di X elevato alla seconda, e mi viene 2652,91 mentre quello di Y viene 5110,93
il problema è che quando vado a calcolare la devianza mi viene un numero negativo, perchè per X calcolo la media meno gli elementi, in questo caso 6, e lo moltiplico per la media elevata alla seconda diviso per n-1, quindi 5
2652,91-6(20,61)2 / 5
perchèèèèèèèè, voglio piangere

allora, ho questo problema di statistica:
si pongono a confronto due varietà di meloni misurando la caratteristica della dolcezza con un particolare strumento ottenendo i valori riportati in tabella. dopo aver calcolato la media e la devianza standard, dire quale delle due varietà presenta maggiore variabilità.
verificare con un livello di significatività x=0,05 se le produzioni sono confrontabili, ovvero se rispetto al paramentro considerato i meloni provengono dalla stessa popolazione
X 25,12 17,25 26,42 16,80 22,15 15,92
Y 28,05 28,05 33,20 31,68 25,90 27,58
allora, ho calcolato la media, quindi ho sommato i numeri e diviso per n
la media di X è 20,61 mentre la media di Y è 29,08.
poi per calcolare la devianza devo passareprima dalla varianza, quindi ho calcolato ogni elemento di X elevato alla seconda, e mi viene 2652,91 mentre quello di Y viene 5110,93
il problema è che quando vado a calcolare la devianza mi viene un numero negativo, perchè per X calcolo la media meno gli elementi, in questo caso 6, e lo moltiplico per la media elevata alla seconda diviso per n-1, quindi 5
2652,91-6(20,61)2 / 5
perchèèèèèèèè, voglio piangere
Risposte
ho provato a ricalcolare, ho preso i singoli valori ed ho sottratto la media
quindi (25,12-20,61) alla seconda, (17,25-20,61) alla seconda..... ed alla fine ho 104,28
però questa dovrebbe essere la mia devianza, vero?
calcoli a caso...
quindi (25,12-20,61) alla seconda, (17,25-20,61) alla seconda..... ed alla fine ho 104,28
però questa dovrebbe essere la mia devianza, vero?
calcoli a caso...

Sì, $104.28$ è la devianza. Il calcolo che hai fatto è quello della definizione di devianza, cioè $\sum_{i=1}^n (x_i-\bar{x})$
Però potevi arrivarci più "velocemente" passando per la varianza, come avevi giustamente pensato di fare all'inizio e quindi fare la media dei quadrati delle osservazioni meno il quadrato della media e poi moltiplicare per $6$ per riportarti alla devianza.
Cioè, $(25.12^2+17.25^2+26.42^2+16.8^2+22.15^2+15.92^2)/6 - 20.61^2=17.378$ e $17.378*6=104.27$
Avevi fatto un po' di "casino" in quel calcolo alla fine del tuo primo messaggio
Però potevi arrivarci più "velocemente" passando per la varianza, come avevi giustamente pensato di fare all'inizio e quindi fare la media dei quadrati delle osservazioni meno il quadrato della media e poi moltiplicare per $6$ per riportarti alla devianza.
Cioè, $(25.12^2+17.25^2+26.42^2+16.8^2+22.15^2+15.92^2)/6 - 20.61^2=17.378$ e $17.378*6=104.27$
Avevi fatto un po' di "casino" in quel calcolo alla fine del tuo primo messaggio

però il ragionamento va bene comunque vero?
poi per sapere quale delle due varità ha maggiore variabilità calcolo la varianza?
quindi 104,28: n-1 che viene 20,86 per X
mentre per Y viene 38,21: n-1 che è 7,64
quindi X ha la maggiore variabilità?
grazie mille per la risposta
poi per sapere quale delle due varità ha maggiore variabilità calcolo la varianza?
quindi 104,28: n-1 che viene 20,86 per X
mentre per Y viene 38,21: n-1 che è 7,64
quindi X ha la maggiore variabilità?
grazie mille per la risposta
Non capisco perché ce l'hai sempre con quell'$n-1$ 
La varianza di $X$ è il $17.38$ calcolato sopra, cioè la devianza diviso $n$
La tua conclusione è corretta, però dovresti calcolarti il coefficiente di variazione, cioè $sigma/mu$ che è l'indice più adatto per confrontare la variabilità di due caratteri.

La varianza di $X$ è il $17.38$ calcolato sopra, cioè la devianza diviso $n$
La tua conclusione è corretta, però dovresti calcolarti il coefficiente di variazione, cioè $sigma/mu$ che è l'indice più adatto per confrontare la variabilità di due caratteri.
Credo che Maria faccia bene a dividere per $n-1$ in quanto sta calcolando la varianza campionaria, uno stimatore della varianza della popolazione.
Mettere $n-1$ al denominatore ci garantisce di avere uno stimatore corretto (privo di distorsione).
Mettere $n-1$ al denominatore ci garantisce di avere uno stimatore corretto (privo di distorsione).
Sì, ma io la varianza campionaria corretta la userei per la seconda parte dell'esercizio, cioè per quanto riguarda la verifica d'ipotesi che è un argomento di Inferenza.
La prima parte è più che altro un esercizio di statistica descrittiva, nel quale non siamo interessati alla non distorsione dello stimatore della varianza.
La prima parte è più che altro un esercizio di statistica descrittiva, nel quale non siamo interessati alla non distorsione dello stimatore della varianza.
OK

"Arado90":
Non capisco perché ce l'hai sempre con quell'$n-1$
La varianza di $X$ è il $17.38$ calcolato sopra, cioè la devianza diviso $n$
La tua conclusione è corretta, però dovresti calcolarti il coefficiente di variazione, cioè $sigma/mu$ che è l'indice più adatto per confrontare la variabilità di due caratteri.
quindi mi conviene svolgere l'esercizio come hai fatto te...
adesso provo a rifarlo... e calcolo anche il coefficiente di variazione, guardiamo che succede
edit:non c'è speranza, allora il cdv di X dovrebbe essere 0,5%
la devianza di Y mi viene 6,17 e la varianza 37,05
però quando vado a calcolare il cdv di Y mi esce (37,05:29,08)x100= 127,4%
la matematica di odia, lo so... ma non fino a questo punto...
Il $sigma$ al numeratore è la radice della varianza $sigma^2$, quindi il Coefficiente di variazione di $X$ è $sqrt(17.38)/20.61=0.202$
Per quanto riguarda $Y$ la varianza è il $6.17$ che hai "chiamato" devianza. (Perché hai confuso le due cose?)
Quindi il suo CdV è $sqrt(6.17)/29.08=0.085$
E quindi possiamo concludere che $X$ è più variabile di $Y$
Per quanto riguarda $Y$ la varianza è il $6.17$ che hai "chiamato" devianza. (Perché hai confuso le due cose?)
Quindi il suo CdV è $sqrt(6.17)/29.08=0.085$
E quindi possiamo concludere che $X$ è più variabile di $Y$
grazie mille, io vorrei sinceramente farti una statua, per la gentilezza e per il tempo perso...
che per te queste cose saranno facilissime, ma a me vien da piangere...
posso essere sfacciata?
come faccio a sapere se provengono dalla stessa popolazione?
che per te queste cose saranno facilissime, ma a me vien da piangere...

posso essere sfacciata?
come faccio a sapere se provengono dalla stessa popolazione?
Devi usare un test per la verifica dell'ipotesi che i due campioni siano estratti dalla stessa popolazione. Uno dei test adatti è quello di Kolmogorov-Smirnov, però in questo caso dovresti usare R per i calcoli inserendo i due vettori ed usando il comando "ks.test(x,y)" per poi confrontare il p-value con l'$alpha=0.05$.
Almeno, la soluzione che viene in mente a me al momento è questa. Non so se magari qualcuno ha qualche altra idea..
Almeno, la soluzione che viene in mente a me al momento è questa. Non so se magari qualcuno ha qualche altra idea..
"Arado90":
Almeno, la soluzione che viene in mente a me al momento è questa. Non so se magari qualcuno ha qualche altra idea..
A me viene in mente anche il test di Student per la differenza tra medie o l'analisi delle varianza.
Poi dipende anche da Maria66 cosa ha studiato, nel senso se l'esercizio è su un particolare argomento cui "ispirarsi"

allora, io ho un esercizio simile svolto, non so che metodo sia, però nella formula ho
[ media di X - Tg*0,05 x ( varianza: $ sqrt(10) $) ; media di X + Tg*0,05 x ( varianza: $ sqrt(10) $)]
credoc he la formula sia giusta
[ media di X - Tg*0,05 x ( varianza: $ sqrt(10) $) ; media di X + Tg*0,05 x ( varianza: $ sqrt(10) $)]
credoc he la formula sia giusta
Questo mi pare un intervallo di confidenza per la media di $X$

ciao, mi chiamo Maria e scrivo cose a caso...
potrebbe essere
(1/Na + 1/Nb) x (Sx di a (n-1) + Sx di b (n-1) tutto fratto (Na + Nb) - 2
poi sotto calcolo T= (media di a - media di b) / il risultato dell'operazione sopra?
grazie mille per la pazienza

potrebbe essere
(1/Na + 1/Nb) x (Sx di a (n-1) + Sx di b (n-1) tutto fratto (Na + Nb) - 2
poi sotto calcolo T= (media di a - media di b) / il risultato dell'operazione sopra?
grazie mille per la pazienza
Na, Nb e Sx che sono?
Comunque dall'aspetto potrebbe essere il metodo giusto xD
Comunque dall'aspetto potrebbe essere il metodo giusto xD
eccomi, ero a ripetizioni stamani
allora, Na è il numero di elementi di a, Nb di quelli di b
Sx potrebbe essere la varianza?

allora, Na è il numero di elementi di a, Nb di quelli di b
Sx potrebbe essere la varianza?
aiutatemi vi pregooo
l'esame è domani e sono in paranoia

Sì, Sx dovrebbe essere la varianza campionaria corretta, se ho capito bene la formula!
Quello dovrebbe essere il test t per l'uguaglianza delle medie, ed è un modo per arrivare alla soluzione che cerchi
Quello dovrebbe essere il test t per l'uguaglianza delle medie, ed è un modo per arrivare alla soluzione che cerchi
grazie ancora
quindi, alla fine di tutto io come risultato ho 1,96
poi calcolo (media di X - media di Y) /il risultato dell'operazione prima
e viene -4,32
poi cerco nella tabella il risultato che corrisponde a 0,05 con il numero 10 ( 6 numeri di X + 6 numeri di Y - 2) ed è 2,228
quindi ho -4,32 e 2,228
però capisco come faccio a dire se appartengono alla stessa popolazione
quindi, alla fine di tutto io come risultato ho 1,96
poi calcolo (media di X - media di Y) /il risultato dell'operazione prima
e viene -4,32
poi cerco nella tabella il risultato che corrisponde a 0,05 con il numero 10 ( 6 numeri di X + 6 numeri di Y - 2) ed è 2,228
quindi ho -4,32 e 2,228
però capisco come faccio a dire se appartengono alla stessa popolazione