Info su un esercizio test d'ipotesi

Salve a tutti ragazzi sono di fronte a questo problema:
Avendo ottenuto il successo 2 volte su 6 tentativi, si valuti a quale livello di significatività si può rigettare $ H_0=[p=0.9] $ essendo $ p $ la probabilità di successo.

Ho pensato di fare così: devo cercare la probabilità di rigetto, quindi $ alpha $ .
Ora come contro ipotesi suppongo che $ p<0.9 $ . Quindi:
$ hat(p) $ =2/6
Approssimando ad una gaussiana standard:
$ (hat(p) -p)/(hat(p)*((1-hat(p)))/n)^(1/2) $
$ P(U<(0,33 -0.9)/(0,33*((1-0.33))/6)^(1/2))=alpha $
Dalle tabelle della gaussiana standard: $ alpha=0.0015 $

Ho proseguito così, vorrei un vostro parere. Grazie mille!

Risposte
ghira1
Della statistica non so quasi nulla ma usare la Gaussiana qui mi sembra una scelta coraggiosa. $n=6$ e $p=0,9$? Puoi usare la binomiale direttamente.

"ghira":
Della statistica non so quasi nulla ma usare la Gaussiana qui mi sembra una scelta coraggiosa. $n=6$ e $p=0,9$? Puoi usare la binomiale direttamente.

Innanzitutto grazie della risposta.
Si avevo pensato che fosse azzardato approssimare alla gaussiana la distribuzione, però con la binomiale non so come avrei dovuto formulare il problema. Cioè, avrei dovuto cercare la probabilità che i successi fossero stati minori o al limite uguali a 2 per cercare la probabilità di rigetto?

Lo_zio_Tom
"ghira":
... usare la Gaussiana qui mi sembra una scelta coraggiosa.


In realtà l'approssimazione Gaussiana qui è del tutto lecita: Si può approssimare la Binomiale con una gaussiana quando $np>=5$....qui viene $np=5.4$

...siamo proprio al limite ma si può fare.

Volendo usare direttamente la binomiale (scelta comunque consigliata) basta valutare la probabilità della coda (il P-value del test):

$P_("Value")=sum_(x=0)^(2)((6),(x))0.9^x 0.1^(6-x)~~0.13%$

come vedi il risultato è il medesimo. Oltretutto come livello di significatività non si scende mai sotto l'$1%$

Qui il pvalue è bassissimo quindi si rifiuta senza alcun problema a qualunque livello di significatività del test.

@Matteo: in questo caso è abbastanza ovvio che il test sia unilaterale ma per non creare confusione è importante specificare sempre anche l'ipotesi alternativa

ghira1
"tommik":
In realtà l'approssimazione Gaussiana qui è del tutto lecita: Si può approssimare la Binomiale con una gaussiana quando $np>=5$....qui viene $np=5.4$

...siamo proprio al limite ma si può fare.


Ma mi è stato detto che vogliamo anche $nq\ge5$, che qui non vale. Vedo questo su, per esempio, https://it.wikipedia.org/wiki/Distribuzione_binomiale - Mi rendo conto che Wikipedia non è esattamente la fonte di tutto il sapere umano ma ho visto questo consiglio anche altrove. Mi sento un po' nervoso in questo caso, tutto qui.

$n=6$ sembra talmente piccolo che usare una qualsiasi approssimazione sembra un po' strano.

Lo_zio_Tom
sì è vero....ma qui il test è unilaterale, e come vedi il valore esatto coincide con quello stimato....comunque la scelta della binomiale è quella consigliata.

In genere io faccio sempre il contrario di ciò che ho detto qui: finché posso uso la distribuzione esatta

ghira1
D'accordo, ovviamente, sul test unilaterale.

Lo_zio_Tom
Tra l'altro non avevo nemmeno letto bene la soluzione dell'OP

@Matteo: Il test che hai scritto è sbagliato.

La statistica test è la seguente

$(1/3-0.9)/sqrt((0.9*0.1)/6)$

e ciò in quanto il livello di significatività osservato è $mathbb{P}[X<=1/3 |mathcal(H)_0]$...tu hai fatto un miscuglio pericoloso.

[ot]per leggere sti topic occorre avere 100 occhi...fate un po' di attenzione quando ricopiate le formule dal libro...oppure ragionate[/ot]

che dà un pvalue ancora più basso...quindi sì, è meglio usare la distribuzione esatta.

ghira1
E se proprio dobbiamo usare l'approssimazione qui non sarebbe il caso di guardare $2,5$ invece di $2$? La correzione di continuità. https://it.wikipedia.org/wiki/Correzion ... nuit%C3%A0 - la faccio abitualmente se devo usare queste approssimazioni.

Lo_zio_Tom
dunque @ghira.

Per applicare il fattore di correzione di $+0.5$ il problema avrebbe dovuto essere impostato diversamente, ovvero sui valori assoluti della variabile (correttamente hai fatto $2+0.5$)

Qui invece il "ragazzo" ha utilizzato un test sulla proporzione e quindi il fattore di correzione non può essere più $0.5$ ma deve essere $1/(2xxn)$

Tieni presente anche che, contrariamente al calcolo delle probabilità, nella prova di ipotesi l'utilizzo del fattore di correzione non è così diffuso: il test passa o non passa, poco importa il risultato. Se applicando un fattore di correzione il test fa cambiare la decisione significa che il test è troppo borderline....quindi in tale caso occorre riflettere sulla decisione da prendere, facendo altri test.

CONCLUSIONE
Ora, per non confondere definitivamente le idee[nota]alla fine è una questione di lana caprina perché gira e rigira il risultato è sempre lo stesso:si rifiuta a qualunque livello di significatività, dato che il pvalue è un ordine di grandezza più piccolo dell'1%[/nota], diciamo che in questo caso è meglio usare la binomiale come hai detto all'inizio e come ho calcolato analiticamente qui

"tommik":


$P_("Value")=sum_(x=0)^(2)((6),(x))0.9^x 0.1^(6-x)~~0.13%$



e ricordare che, in linea generale, la statistica test per la prova di ipotesi nel caso di proporzioni campionarie (approssimate con la gaussiana) è la seguente

$Z_("Stat")=(bar(p)-p_0)/sqrt(p_0(1-p_0)) sqrt(n)~Phi$

dove $p_0$ è il valore di $p$ sotto ipotesi nulla $mathcal(H)_0$

mentre $bar(p)$ è il valore della media campionaria

OSSERVAZIONE IMPORTANTE

La formula della statistica test può creare confusione perché quando si calcolano gli intervalli di confidenza della proporzione la quantità pivotale da usare è questa:

$(bar(p)-p)/sqrt(bar(p)(1-bar(p))) sqrt(n)~Phi$

che è esattamente come ha fatto @Matteo all'inizio. Non vi è alcuna contraddizione in ciò in quanto la formula usata negli intervalli di confidenza non è la formula esatta dell'approssimazione [nota]formula esatta dell'approssimazione è un ossimoro...lo so[/nota] che invece dovrebbe essere questa

$(bar(p)-p)/sqrt(p(1-p)) sqrt(n)~Phi$

Ora per l'intervallo di confidenza occorrerebbe risolvere una doppia disuguaglianza in $p$ che genera una formula per l'intervallo di confidenza poco gestibile (guarda qui per un approfondimento) e quindi si adotta un'approssimazione dell'approssimazione sostituendo al denominatore $bar(p)$ al posto di $p$; in altre parole si sostitusce alla varianza della popolazione la sua stima di massima verosimiglianza...

Nella prova di ipotesi il problema di calcolo non si pone e quindi si lascia giustamente al denominatore ciò che ci deve stare, ovvero il valore di $p$ fissato in $mathcal(H)_0$

Sicuramente sono stato un po' troppo sbrigativo ma la questione è tutt'altro che semplice da spiegare in poche parole. Sul forum comunque in vari anni di partecipazione ho spiegato la questione in numerosi topic che sono ben visibili e facili da reperire tramite la funzione "cerca"

Spero comunque di essere stato chiaro

Innanzitutto grazie mille.
Tommik sei stato chiarissimo, è vero ho sbagliato li usando l'approssimazione usata per gli intervalli di confidenza, che somaro.
Per l'ipotesi alternativa, scusate l'ho scritta solo tra le righe, imponendo p<0.9.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.