Esercizio distribuzione normale
Salve a tutti,
sto facendo un esercizio di statistica ma mi sono fermata a un punto in cui mi viene una cosa strana che non mi aspettavo...
L'esercizio è questo:
"Sono state misurate le lunghezze di 150 sbarrette di metallo simili, e i dati sono raggruppati così:
$27
$28
$29
$30
$31
Stabilire se in base a questi dati si può affermare che la lunghezza delle sbarrette segue una distribuzione normale."
Vi metto tutti i passaggi che ho fatto e i numeri che ho ottenuto, così potete aiutarmi più facilmente a capire dove sbaglio.
Ho proceduto in questo modo: per prima cosa ho trovato il valor medio $\bar x = 29,92$ (che corrisponderebbe al valore aspettato m della rispettiva distribuzione normale) e la varianza $\sigma=0,978$.
Poi, poichè la variabile era discreta, l'ho resa continua per adattarla alla distribuzione di Gauss, e ho trovato il rispettivo valore della variabile di Gauss normalizzato(l'ho chiamato z, ed è $z=(x-m)/\sigma$):
x=26,5 z=-3,50
x=28,5 z=-1,45
x=27,5 z=-2,74
x=29,5 z=-0,43
x=30,5 z=0,59
x=31,5 z=1,62
x=32,5 z=2,64
A questo punto, ho calcolato servendomi della tabella della distribuzione normale le probabilità di trovare le lunghezze in ognuno degli intervalli:
$P(26,5<=x<=28,5)=$ 7% cioè circa 10 volte
$P(27,5<=x<=29,5)=$ 33% cioè circa 50 volte
$P(28,5<=x<=30,5)=$ 65% cioè circa 98 volte
$P(29,5<=x<=31,5)=$ 61% cioè circa 92 volte
$P(30,5<=x<=32,5)=$ 27% cioè circa 41 volte
ma la somma di queste frequenze aspettate non fa 150!! Proseguirei l'esercizio facendo il test del $\chi^2$ , ma non so come interpretare quello che ho appena ottenuto. Mi aiutate a capire dove e perchè ho sbagliato?
Grazie in anticipo
Valentina
sto facendo un esercizio di statistica ma mi sono fermata a un punto in cui mi viene una cosa strana che non mi aspettavo...
L'esercizio è questo:
"Sono state misurate le lunghezze di 150 sbarrette di metallo simili, e i dati sono raggruppati così:
$27
Vi metto tutti i passaggi che ho fatto e i numeri che ho ottenuto, così potete aiutarmi più facilmente a capire dove sbaglio.
Ho proceduto in questo modo: per prima cosa ho trovato il valor medio $\bar x = 29,92$ (che corrisponderebbe al valore aspettato m della rispettiva distribuzione normale) e la varianza $\sigma=0,978$.
Poi, poichè la variabile era discreta, l'ho resa continua per adattarla alla distribuzione di Gauss, e ho trovato il rispettivo valore della variabile di Gauss normalizzato(l'ho chiamato z, ed è $z=(x-m)/\sigma$):
x=26,5 z=-3,50
x=28,5 z=-1,45
x=27,5 z=-2,74
x=29,5 z=-0,43
x=30,5 z=0,59
x=31,5 z=1,62
x=32,5 z=2,64
A questo punto, ho calcolato servendomi della tabella della distribuzione normale le probabilità di trovare le lunghezze in ognuno degli intervalli:
$P(26,5<=x<=28,5)=$ 7% cioè circa 10 volte
$P(27,5<=x<=29,5)=$ 33% cioè circa 50 volte
$P(28,5<=x<=30,5)=$ 65% cioè circa 98 volte
$P(29,5<=x<=31,5)=$ 61% cioè circa 92 volte
$P(30,5<=x<=32,5)=$ 27% cioè circa 41 volte
ma la somma di queste frequenze aspettate non fa 150!! Proseguirei l'esercizio facendo il test del $\chi^2$ , ma non so come interpretare quello che ho appena ottenuto. Mi aiutate a capire dove e perchè ho sbagliato?
Grazie in anticipo
Valentina
Risposte
due domande:
prendiamo il primo gruppo $27
Perchè le probabilità che trovi alla fine si sovrappongono?
A me personalmente risulta oscuro un po' tutto quello che hai fatto, non è che puoi mettere dei dettagli in più?
prendiamo il primo gruppo $27
Perchè le probabilità che trovi alla fine si sovrappongono?
A me personalmente risulta oscuro un po' tutto quello che hai fatto, non è che puoi mettere dei dettagli in più?
Non so che altri dettagli mettere più di questi! Cioè, prima considero quell'intervallo e poi l'altro perchè avrei reso continua una variabile discreta, però, adesso che mi fai notare che gli intervalli si sovrappongono, evidentemente l'ho fatto male... ma forse la variabile è già continua e non dovevo farlo proprio?
Gli intervalli inizialmente non si sovrappongono e poi alla fine lo fanno, questo penso sia un errore....quando dici "ho reso continua" cosa intendi, che operazione fai?
La media e $\sigma$ come l'hai trovate?
La media e $\sigma$ come l'hai trovate?
Per la media ho sommato (e poi diviso per 5) tutti i valori in mezzo agli intervalli, tipo per il primo intervallo ho preso 27.5, per il secondo 28.5, e così via; in effetti non sono sicurissima che sia giusto, ma non mi veniva in mente nient'altro per trovarla e mi sembrava la cosa più sensata.. poi per $\sigma$ ho fatto $\sigma=sqrt(1/4 \sum_i (\bar x - x_i)^2)$ ; il discorso di "ho reso continua" sarebbe che, quando ho un valore discreto nei dati, tipo 5, non posso dire che una funzione continua come quella di Gauss può assumere quel valore preciso, ma potrà avere un valore compreso tra 4.5 e 5.5. Però in effetti in quell'esercizio ci sono già degli intervalli... e la somma di quegli intervalli è un intervallo unico più grande, quindi forse non lo dovevo fare, forse la variabile x è già continua.. Ma allora come faccio a trovare la media?Cioè, il valore aspettato della distribuzione di Gauss che voglio associare a quel campione di dati? Con un integrale?
Allora: la media è giusta o almeno è un metodo coerente (anche io avrei fatto lo stesso).
La varianza invece è sbagliata, non capisco bene la formula però mi sembra di capire capire che il temine $()^2$ comprenda anche la sommatoria, invece deve essere solo su la media meno l'osservazione. Il secondo punto della varianza è che va diviso per la somma delle frequenze (magari -1) e ogni valore va moltiplicato per la sua frequenza, è praticamente una varianza (o media) pesata.
Quando vuoi invice trovare le probabilità nella normale, devi prendere gli intervalli delle tue osservazioni e vedere a csa corrispondono nella normale e vedere a che probabilità corrispondono.
La varianza invece è sbagliata, non capisco bene la formula però mi sembra di capire capire che il temine $()^2$ comprenda anche la sommatoria, invece deve essere solo su la media meno l'osservazione. Il secondo punto della varianza è che va diviso per la somma delle frequenze (magari -1) e ogni valore va moltiplicato per la sua frequenza, è praticamente una varianza (o media) pesata.
Quando vuoi invice trovare le probabilità nella normale, devi prendere gli intervalli delle tue osservazioni e vedere a csa corrispondono nella normale e vedere a che probabilità corrispondono.
Si si si hai ragione, mi ero sbagliata a scrivere la formula della varianza, ora l'ho corretta e si vede anche; il conto però l'avevo fatto bene, anche moltiplicando ogni valore per la frequenza. Ora lo sto rifacendo senza fare quella cosa sugli intervalli, e in effetti viene bene! Adesso mi faccio il test del $\chi^2$ , ed è fatto. Grazie mille dell'aiuto!