Problema di inferenza
Il problema viene posto in questa maniera dalla mia prof:
Di 300 arance prelevate a caso da una partita consegnata ad un supermercato 25 sono risultate invendibili perché troppo mature.
a) Fornire una stima della percentuale di arance invendibili della partita
b) Descrivere lo stimatore utilizzato al punto a)
c) Si verifichi che la probabilità di estrarre un’arancia invendibile sia 0.01 con
d) Si determini il valore del p-value
e) Si determini la potenza del test sotto l’ipotesi alternativa che la probabilità di estrarre un’arancia invendibile sia 0.08
Per il primo punto credevo di dover fare una semplice percentuale, però quando mi viene chiesto di descrivere lo stimatore usato al punto a non so cosa rispondere.
Per risolvere il punto c stavo pensando di trattare il tutto come una binomiale, porre Ho: P= 0,01. Il problema è che non avendo un livello di significatività non so come comportarmi.
Di 300 arance prelevate a caso da una partita consegnata ad un supermercato 25 sono risultate invendibili perché troppo mature.
a) Fornire una stima della percentuale di arance invendibili della partita
b) Descrivere lo stimatore utilizzato al punto a)
c) Si verifichi che la probabilità di estrarre un’arancia invendibile sia 0.01 con
d) Si determini il valore del p-value
e) Si determini la potenza del test sotto l’ipotesi alternativa che la probabilità di estrarre un’arancia invendibile sia 0.08
Per il primo punto credevo di dover fare una semplice percentuale, però quando mi viene chiesto di descrivere lo stimatore usato al punto a non so cosa rispondere.
Per risolvere il punto c stavo pensando di trattare il tutto come una binomiale, porre Ho: P= 0,01. Il problema è che non avendo un livello di significatività non so come comportarmi.
Risposte
a) $25/300=0.083$
b) lo stimatore trovato è $bar(p)=bar(x)$. E' la media campionarie ed è lo stimatore di massima verosimiglianza.
Lo stimatore "media campionaria" gode delle seguenti proprietà:
- è non distorto
- è invariante
- è consistente
- è il più efficiente
- è asintoticamente distribuito in modo Gaussiano
- è funzione dello stimatore sufficiente (se esiste)
c) il testo ci chiede di verificare che
${{: ( H_(0):mu=0.01 ),( H_(1): mu> 0.01) :}$
con un'ampiezza pari a $alpha=0.05$
calcoliamo quindi la statistica test
$Z_(s t a t)=(bar(p)-p_(0))/sqrt((p_(0)(1-p_(0)))/n)=12.77$
quindi senza fare conti si vede che il pvalue ->0
d) prima di calcolare la potenza del test, dobbiamo calcolare la regola di decisione, ovvero quel valore di $bar(p)$ considerato di soglia fra l'accettazione ed il rifiuto dell'ipotesi di lavoro.
$(bar(p)-0.01)/sqrt((0.01\cdot0.99)/300)=1.645$
da cui $bar(p)=0.02$
a questo punto possiamo modificare il sistema di ìpotesi iniziale inserendo il dato del testo (e quindi modificando l'ipotesi alternativa da composta a semplice, che aiuta...)
${{: ( H_(0):mu=0.01 ),( H_(1): mu=0.08) :}$
e, ricordando che la potenza del test è la probabilità di rifiutare l'ipotesi quando è vera l'alternativa....
$gamma=P{bar(p)>0.02|p=0.08)=P{Z>(0.02-0.08)/sqrt((0.08\cdot0.92)/300)}=P{Z> -3.52}=0.9998$
Ora, caro Mazzariello, ti ho mostrato TUTTI i passaggi nei dettagli; come vedi ho scritto le formule in maniera comprensibile (non come hai fatto tu in PM
)...spero che al prossimo topic, se necessario, sarai così gentile da fare altrettanto...altrimenti...ti aiuterà qualcun altro
********************************
certo che se con i dati del problema avesse chiesto di verificare che un'arancia invendibile sia 0.1 l'esercizio sarebbe stato più interessante....ma tant'è....
************************************
cordiali saluti
b) lo stimatore trovato è $bar(p)=bar(x)$. E' la media campionarie ed è lo stimatore di massima verosimiglianza.
Lo stimatore "media campionaria" gode delle seguenti proprietà:
- è non distorto
- è invariante
- è consistente
- è il più efficiente
- è asintoticamente distribuito in modo Gaussiano
- è funzione dello stimatore sufficiente (se esiste)
c) il testo ci chiede di verificare che
${{: ( H_(0):mu=0.01 ),( H_(1): mu> 0.01) :}$
con un'ampiezza pari a $alpha=0.05$
calcoliamo quindi la statistica test
$Z_(s t a t)=(bar(p)-p_(0))/sqrt((p_(0)(1-p_(0)))/n)=12.77$
quindi senza fare conti si vede che il pvalue ->0
d) prima di calcolare la potenza del test, dobbiamo calcolare la regola di decisione, ovvero quel valore di $bar(p)$ considerato di soglia fra l'accettazione ed il rifiuto dell'ipotesi di lavoro.
$(bar(p)-0.01)/sqrt((0.01\cdot0.99)/300)=1.645$
da cui $bar(p)=0.02$
a questo punto possiamo modificare il sistema di ìpotesi iniziale inserendo il dato del testo (e quindi modificando l'ipotesi alternativa da composta a semplice, che aiuta...)
${{: ( H_(0):mu=0.01 ),( H_(1): mu=0.08) :}$
e, ricordando che la potenza del test è la probabilità di rifiutare l'ipotesi quando è vera l'alternativa....
$gamma=P{bar(p)>0.02|p=0.08)=P{Z>(0.02-0.08)/sqrt((0.08\cdot0.92)/300)}=P{Z> -3.52}=0.9998$
Ora, caro Mazzariello, ti ho mostrato TUTTI i passaggi nei dettagli; come vedi ho scritto le formule in maniera comprensibile (non come hai fatto tu in PM

********************************
"vale.mazzariello":
c) Si verifichi che la probabilità di estrarre un’arancia invendibile sia 0.01 con
certo che se con i dati del problema avesse chiesto di verificare che un'arancia invendibile sia 0.1 l'esercizio sarebbe stato più interessante....ma tant'è....
************************************
cordiali saluti
Stavo cercando in rete e ho trovato finalmente ciò che mi serviva, la prof nel suo copia e incolla ha dimenticato di mettere la significatività del test che è 0,05, quindi ora visto che n è molto grande posso fare come avevo pensato
"tommik":
calcoliamo quindi la statistica test
$Z_(s t a t)=(bar(p)-p_(0))/sqrt((p_(0)(1-p_(0)))/n)=12.77$
quindi senza fare conti si vede che il pvalue ->0
al denominatore, sotto la radice...quella non è la varianza di una Bernoulli? da cosa capiamo che si tratta proprio di una Bernoulliana?

"tommik":
e, ricordando che la potenza del test è la probabilità di rifiutare l'ipotesi quando è vera l'alternativa....
$gamma=P{bar(p)>0.02|p=0.08)=P{Z>(0.02-0.08)/sqrt((0.08\cdot0.92)/300)}=P{Z> -3.52}=0.9998$
rifacendo l'esercizio
