Problema su deviazione standard e rigetto dei dati
Salve a tutti,
facendo degli esercizi di Laboratori di Fisica, mi sono imbattuto in un esercizio che dice:
"Siano dati una moneta con facce numerate con i numeri 1 e 2 rispettivamente e un dado a 6 facce con uscite da 1 a 6. Per ogni
lancio simultaneo dei due oggetti, si indichi con OUT 1 l’uscita della moneta e OUT 2 l’uscita del dado; si consideri la variabile somma data da: OUT = OUT 1 + OUT 2."
Poi mi da questa tabella:
Vuole, tra gli altri quesiti,che, una volta individuato il dato sospetto, si decida se è rigettabile o no. Sinceramente non so se in questo contesto sia possibile utilizzare il criterio di Chauvenet per il rigetto oppure no. Ho fatto tutto il resto ma questo fatto mi perplime,
P.S. Ho postato in Statistica e probabilità perché è un problema statistico, se lo si ritiene opportuno lo sposterò in Fisica.
facendo degli esercizi di Laboratori di Fisica, mi sono imbattuto in un esercizio che dice:
"Siano dati una moneta con facce numerate con i numeri 1 e 2 rispettivamente e un dado a 6 facce con uscite da 1 a 6. Per ogni
lancio simultaneo dei due oggetti, si indichi con OUT 1 l’uscita della moneta e OUT 2 l’uscita del dado; si consideri la variabile somma data da: OUT = OUT 1 + OUT 2."
Poi mi da questa tabella:
OUT | moleplicità |
---|---|
38 | 3 |
4 | 98 |
78 | 6 |
7 | 71 |
Vuole, tra gli altri quesiti,che, una volta individuato il dato sospetto, si decida se è rigettabile o no. Sinceramente non so se in questo contesto sia possibile utilizzare il criterio di Chauvenet per il rigetto oppure no. Ho fatto tutto il resto ma questo fatto mi perplime,
P.S. Ho postato in Statistica e probabilità perché è un problema statistico, se lo si ritiene opportuno lo sposterò in Fisica.
Risposte
"Michele Macchi":
Sinceramente non so se in questo contesto sia possibile utilizzare il criterio di Chauvenet per il rigetto oppure no.
sì, si può. Data la grande numerosità delle osservazioni si può tranquillamente assumere la normalità della distribuzione. Esistono tuttavia numerose altre vie per risolvere...io utilizzerei un test $chi^2$
Se sei interessato mostra dunque una possibile soluzione
PS: Statistica va più che bene..tra l'altro il quesito è molto interessante dato che ci sono numerose strade risolutive e quindi potremmo vedere le varie proposte...
ciao
Esattamente. Ho fatto il test del \( \chi^2 \) e mi è venuto 17,7, dividendo per il numero di gradi di libertà (che sono 6, se non sbaglio) il \( \chi_{rid}^2 \) mi è venuto 2,95 che con 6 gradi di libertà ha probabilità di circa 0,6%, quindi l'ipotesi può essere rigettata al di sotto dell'alta significatività. Dopodiché ho notato che il dato che contribuiva maggiormente al \( \chi^2 \) era 107. Calcolo, facendo un'appossimazione gaussiana, a quante \( \sigma \) dalla media si trovi: \[ t=\frac{|107-83,33|}{\sqrt{83,33}} = 2,59. \] La probabilità di una misura al di fuori di \( 2,59\sigma \) è 0,96%. Applicando il criterio di Chauvenet ottengo che una misura così discrepante su 500 misure si può ottenere in \[ 500 \cdot 0,0096 = 4,8 \] misure. Poiché \( 4,8 > \frac{1}{2} \) allora, per Chauvenet, non si rigetta la misura.
Questo è quello che ho fatto. Adesso mi sorgeva la perplessità: ma il criterio di Chauvenet non si applica a misure singole? Ovvero, in questo caso io ho diviso le misure in canali, ogni canale mi dà la "molteplicità" dell'uscita 3.
Forse è che 107 è considerata "una misurazione" e non solo un conteggio?
In effetti mi sono accorto di fare tutti i problemi allo stesso modo, quasi meccanicamente. Un differente approccio non sarebbe male!
Questo è quello che ho fatto. Adesso mi sorgeva la perplessità: ma il criterio di Chauvenet non si applica a misure singole? Ovvero, in questo caso io ho diviso le misure in canali, ogni canale mi dà la "molteplicità" dell'uscita 3.
Forse è che 107 è considerata "una misurazione" e non solo un conteggio?
.tra l'altro il quesito è molto interessante dato che ci sono numerose strade risolutive e quindi potremmo vedere le varie proposte...
In effetti mi sono accorto di fare tutti i problemi allo stesso modo, quasi meccanicamente. Un differente approccio non sarebbe male!
Dunque...
il test del $chi^2$ lo hai applicato correttamente, viene 17.7 con un p.value a 6 gdl pari a circa 0.7% quindi, come hai sottolineato, si rifiuta l'ipotesi che i dati appartengano alla distribuzione con un livello di alta significatività.
Ora però, per vedere la probabilità che il valore 3 compaia un numero di volte $>=107$ su $500$ tentativi io userei il teorema del limite centrale secondo cui
$(SigmaX-nmu)/(sigma sqrt(n))~N(0;1)$
e quindi $P(SigmaX>=107}=P{Z>=(106.5-500*1/6)/sqrt(500*1/6*5/6)}=P{Z>=2.78}~~0.27%$
dopodiché applico Chauvenet $rarr 500*0.0023~~1.36>1/2$ e non rigetto il dato. Se si fosse presentato almeno 110 volte lo avrei rigettato
(così almeno è come farei io...)
il test del $chi^2$ lo hai applicato correttamente, viene 17.7 con un p.value a 6 gdl pari a circa 0.7% quindi, come hai sottolineato, si rifiuta l'ipotesi che i dati appartengano alla distribuzione con un livello di alta significatività.
Ora però, per vedere la probabilità che il valore 3 compaia un numero di volte $>=107$ su $500$ tentativi io userei il teorema del limite centrale secondo cui
$(SigmaX-nmu)/(sigma sqrt(n))~N(0;1)$
e quindi $P(SigmaX>=107}=P{Z>=(106.5-500*1/6)/sqrt(500*1/6*5/6)}=P{Z>=2.78}~~0.27%$
dopodiché applico Chauvenet $rarr 500*0.0023~~1.36>1/2$ e non rigetto il dato. Se si fosse presentato almeno 110 volte lo avrei rigettato
(così almeno è come farei io...)
Ecco, infatti. C'era qualcosa che mi mancava. Grazie.