Problema test d'ipotesi con alcuni dubbi
Buondì, allego un'immagine del problema per comodità:
https://puu.sh/xgAKA.png
Per quanto riguarda il primo punto, l'ho impostato così:
$ H_0: mu<=5 $
$ H_1: mu>5 $
che rifiuto se $ t_0>t_(1-alpha, n-1) $, con $ t_0 = (barx-mu_0)/s_n*sqrtn $
da cui la regione critica $ RC: {barx>mu_0+t_(1-alpha ; n-1)*s_n/sqrtn} $ e fin qui penso di esserci. Ora però iniziano i problemi: in primo luogo, per quanto riguarda il punto b), siccome mi dà effettivamente una media e una varianza, devo passare da Student a Standard? Non dice che si tratti di stime, dunque suppongo di poter procedere così... (ho provato in entrambi i modi ma non riesco a farlo tornare).
Ma se passo alla tabella Standard, allora cambiano le condizioni di rifiuto del test, perchè quelle stesse ipotesi verrebbero rifiutate per $ Z_0>=Z_(1-alpha) $ e dunque l'errore di secondo tipo verrebbe una cosa simile a :
$ beta = P(Z_0
Per quanto riguarda l'ultimo punto invece, ho stimato media e varianza e ho rifatto il test del primo punto:
$ barx = 6,527 $
$ s_n = 2,9 $
da cui
$ 6,527 = 5+t_(1-alpha ; 6)*2,9/sqrt7 -> t_(1-alpha ; 6) = 1,39 $, e l'unica cosa che posso concludere è che $ alpha in (0,1 ; 0,15) $, giusto? A questo proposito, ho un dubbio concettuale che probabilmente è sciocco, ma vorrei essere sicuro: a seconda dell'esercizio che trovo, il pedice di $ Z $ o $ T $ che sia passa da $ alpha $ ad $ 1-alpha $ e viceversa. Come so quando usare uno e quando l'altro? Perchè ad esempio quest'ultimo punto, se l'avessi risolto usando la tabella delle zone di rifiuto dei test d'ipotesi che ho (quelle del nostro professore di statistica), la soluzione sarebbe stata $ t_0 > t_(alpha ; n-1) $ e sarebbe uscito quindi $ alpha in (0,85 ; 0,9) $, che per essere un p-value è decisamente esagerato...
Grazie mille a chi avrà la pazienza di aiutarmi.
https://puu.sh/xgAKA.png
Per quanto riguarda il primo punto, l'ho impostato così:
$ H_0: mu<=5 $
$ H_1: mu>5 $
che rifiuto se $ t_0>t_(1-alpha, n-1) $, con $ t_0 = (barx-mu_0)/s_n*sqrtn $
da cui la regione critica $ RC: {barx>mu_0+t_(1-alpha ; n-1)*s_n/sqrtn} $ e fin qui penso di esserci. Ora però iniziano i problemi: in primo luogo, per quanto riguarda il punto b), siccome mi dà effettivamente una media e una varianza, devo passare da Student a Standard? Non dice che si tratti di stime, dunque suppongo di poter procedere così... (ho provato in entrambi i modi ma non riesco a farlo tornare).
Ma se passo alla tabella Standard, allora cambiano le condizioni di rifiuto del test, perchè quelle stesse ipotesi verrebbero rifiutate per $ Z_0>=Z_(1-alpha) $ e dunque l'errore di secondo tipo verrebbe una cosa simile a :
$ beta = P(Z_0
Per quanto riguarda l'ultimo punto invece, ho stimato media e varianza e ho rifatto il test del primo punto:
$ barx = 6,527 $
$ s_n = 2,9 $
da cui
$ 6,527 = 5+t_(1-alpha ; 6)*2,9/sqrt7 -> t_(1-alpha ; 6) = 1,39 $, e l'unica cosa che posso concludere è che $ alpha in (0,1 ; 0,15) $, giusto? A questo proposito, ho un dubbio concettuale che probabilmente è sciocco, ma vorrei essere sicuro: a seconda dell'esercizio che trovo, il pedice di $ Z $ o $ T $ che sia passa da $ alpha $ ad $ 1-alpha $ e viceversa. Come so quando usare uno e quando l'altro? Perchè ad esempio quest'ultimo punto, se l'avessi risolto usando la tabella delle zone di rifiuto dei test d'ipotesi che ho (quelle del nostro professore di statistica), la soluzione sarebbe stata $ t_0 > t_(alpha ; n-1) $ e sarebbe uscito quindi $ alpha in (0,85 ; 0,9) $, che per essere un p-value è decisamente esagerato...
Grazie mille a chi avrà la pazienza di aiutarmi.
Risposte
"tommik":
3) per i pedici vi è ampia tolleranza di indicazione (in altri termini ogni libro li scrive come caXXo gli pare...basta che si capisca)
Temevo mi avresti detto così... nel frattempo ho fatto qualche altro esercizio e ho trovato un p-value (che finora ho sempre visto come valori bassissimi) a 96,8%, quindi vabbe', dipende dal meteo, me ne farò una ragione. Ora recupero il punto due secondo le tue indicazioni, grazie mille per l'aiuto.
EDIT messaggio precedente cancellato.
Complici la fretta e un po' anche il testo scritto in modo criptico ho scritto una mezza fesseria ($3/4$ vah.... ) e ti ho dato indicazioni sbagliate per il punto 2.
La varianza di 9 $ m i n^2$ si riferisce alla varianza della popolazione. Quindi farai il test z. La media di 305 minuti si riferisce alla media sotto $H_1$. Infatti, dato che la richiesta è relativa all'errore $beta $, con l'ipotesi alternativa composta, altrimenti non potresti risolvere. Il procedimento è il seguente:
1 ) si calcola la regola di decisione avendo fissato l'errore di primo tipo pari a 5% e trovando il valore di $bar(x)$ critico.
2) fissato $bar (x) $ critico, si calcola la probabilità di accettare $H_0$ dato $H _1$ e quindi ti serve il valore della media sotto l'ipotesi alternativa.
3) A questo punto, imponendo un valore di $beta<=20%$, puoi facilmente risolvere in $n$.
In sostanza avevi già svolto bene l'esercizio solo che si scrive $|mu_1$ e non $|mu_0$ ma devi aver prima fissato il valore di soglia per la media campionaria critica.
Per il punto 3 mi fido dei conti. Se $t_(s t a t)=1,44$ con 6 gdl il p-value è 10%. Se a te viene 1.39 il p-value sarà poco di più.
Puoi consultare qualunque tavola:

Oppure usare Excel per avere il dato preciso[nota]basta digitare +DISTRIB.T(1.39;6;1) per ottenere il risultato, ovvero un pvalue di 10.7%[/nota].
Altre tavole invece di tabulare il pvalue tabulano la CDF

In questo caso per trovare il pvalue farai il complemento a uno....ma sulla tavola è spiegato bene se tabulano l'area di sinistra oppure di destra. Purtroppo molte volte con entrambe le impostazioni si indica $t_(alpha)$ e anche con la $chi^2$ avviene lo stesso....bisogna un po' intendersi fra addetti ai lavori....se studi Statistica non dovresti meravigliarti.....
Ciao
Complici la fretta e un po' anche il testo scritto in modo criptico ho scritto una mezza fesseria ($3/4$ vah.... ) e ti ho dato indicazioni sbagliate per il punto 2.
La varianza di 9 $ m i n^2$ si riferisce alla varianza della popolazione. Quindi farai il test z. La media di 305 minuti si riferisce alla media sotto $H_1$. Infatti, dato che la richiesta è relativa all'errore $beta $, con l'ipotesi alternativa composta, altrimenti non potresti risolvere. Il procedimento è il seguente:
1 ) si calcola la regola di decisione avendo fissato l'errore di primo tipo pari a 5% e trovando il valore di $bar(x)$ critico.
2) fissato $bar (x) $ critico, si calcola la probabilità di accettare $H_0$ dato $H _1$ e quindi ti serve il valore della media sotto l'ipotesi alternativa.
3) A questo punto, imponendo un valore di $beta<=20%$, puoi facilmente risolvere in $n$.
In sostanza avevi già svolto bene l'esercizio solo che si scrive $|mu_1$ e non $|mu_0$ ma devi aver prima fissato il valore di soglia per la media campionaria critica.
Per il punto 3 mi fido dei conti. Se $t_(s t a t)=1,44$ con 6 gdl il p-value è 10%. Se a te viene 1.39 il p-value sarà poco di più.
Puoi consultare qualunque tavola:

Click sull'immagine per visualizzare l'originale
Oppure usare Excel per avere il dato preciso[nota]basta digitare +DISTRIB.T(1.39;6;1) per ottenere il risultato, ovvero un pvalue di 10.7%[/nota].
Altre tavole invece di tabulare il pvalue tabulano la CDF

Click sull'immagine per visualizzare l'originale
In questo caso per trovare il pvalue farai il complemento a uno....ma sulla tavola è spiegato bene se tabulano l'area di sinistra oppure di destra. Purtroppo molte volte con entrambe le impostazioni si indica $t_(alpha)$ e anche con la $chi^2$ avviene lo stesso....bisogna un po' intendersi fra addetti ai lavori....se studi Statistica non dovresti meravigliarti.....

Ciao
Ed ecco anche una rappresentazione grafica del problema al punto 2)
La gaussiana blu è quella sotto ipotesi $H_0$, media paria 300 minuti
La gaussiane verde e rossa sono quelle sotto $H_1$ quindi con media 305 minuti e varianza che diminuisce all'aumentare di $n$.
L'errore $beta$ è l'area a sinistra del valore critico sotto le curve rossa e verde.....tu devi trovare l'$n$ minimo affinché tale area sia $<=0.2$ e, seguendo le istruzioni del mio post precedente, non dovresti trovare difficoltà

La gaussiana blu è quella sotto ipotesi $H_0$, media paria 300 minuti
La gaussiane verde e rossa sono quelle sotto $H_1$ quindi con media 305 minuti e varianza che diminuisce all'aumentare di $n$.
L'errore $beta$ è l'area a sinistra del valore critico sotto le curve rossa e verde.....tu devi trovare l'$n$ minimo affinché tale area sia $<=0.2$ e, seguendo le istruzioni del mio post precedente, non dovresti trovare difficoltà

Click sull'immagine per visualizzare l'originale
Penso di esserci, ma giusto per conferma, ecco quel che mi è venuto:
$ alpha = 0.05 $
$ mu = 305 $
$ sigma = 3 $
$ H_0: mu<=300 $
$ H_1:mu>300 $
condizione di rifiuto: $ Z_0 >=Z_(1-alpha) = 1,645 $
e regione critica: $ RC: {barx>=300+1,645*3/sqrtn} $
E quindi
$ beta= P(barx<300+1,645*3/sqrtn)<=0,2 $, cioè
$ beta = P(Z<(300-305)/3*sqrtn+1,645*3/sqrtn)<=0,2 $
dalle tavole si ottiene che
$ (300-305)/3*sqrtn+1,645*3/sqrtn = -0,84 -> sqrtn = 1,9911 -> n=3,964 $
dunque $ n>3 $
Per quanto riguarda l'ultimo punto alla fine il procedimento mi è chiaro, era semplicemente perchè non capivo la differenza tra $ alpha $ e $ 1-alpha $, a questo punto per rigore mentale considererò sempre $ 1-alpha $, sono più abituato a lavorare con valori piccoli. L'unica perplessità che mi rimane è... ammettiamo, come dicevo nel mio post precedente, che la risposta "livello di significatività" sia come è venuto a me $ alpha in (0,1 ; 0,15) $. Se io considerassi $ alpha $ e scrivessi il risultato come $ in (0,85 ; 0,9) $, andrebbe altrettanto bene?
Grazie mille, tra le altre cose il grafico ha davvero aiutato a visualizzare il problema.
$ alpha = 0.05 $
$ mu = 305 $
$ sigma = 3 $
$ H_0: mu<=300 $
$ H_1:mu>300 $
condizione di rifiuto: $ Z_0 >=Z_(1-alpha) = 1,645 $
e regione critica: $ RC: {barx>=300+1,645*3/sqrtn} $
E quindi
$ beta= P(barx<300+1,645*3/sqrtn)<=0,2 $, cioè
$ beta = P(Z<(300-305)/3*sqrtn+1,645*3/sqrtn)<=0,2 $
dalle tavole si ottiene che
$ (300-305)/3*sqrtn+1,645*3/sqrtn = -0,84 -> sqrtn = 1,9911 -> n=3,964 $
dunque $ n>3 $
Per quanto riguarda l'ultimo punto alla fine il procedimento mi è chiaro, era semplicemente perchè non capivo la differenza tra $ alpha $ e $ 1-alpha $, a questo punto per rigore mentale considererò sempre $ 1-alpha $, sono più abituato a lavorare con valori piccoli. L'unica perplessità che mi rimane è... ammettiamo, come dicevo nel mio post precedente, che la risposta "livello di significatività" sia come è venuto a me $ alpha in (0,1 ; 0,15) $. Se io considerassi $ alpha $ e scrivessi il risultato come $ in (0,85 ; 0,9) $, andrebbe altrettanto bene?
Grazie mille, tra le altre cose il grafico ha davvero aiutato a visualizzare il problema.
il livello di significatività è 0.1, ovvero l'area della coda (delle code nel caso bilatero) non 0.9....
Per quanto riguarda l'esercizio mi pare ci sia un errore nell'impostazione della standardizzazione:
$(300+(1.65*3)/sqrt(n)-305)/3 sqrt(n) <=-0.84 rarr n>=ceil(1.5^2) rarr n>=3$
non trovi?
PS: il grafico l'ho fatto apposta per farti capire il problema....
Per quanto riguarda l'esercizio mi pare ci sia un errore nell'impostazione della standardizzazione:
$(300+(1.65*3)/sqrt(n)-305)/3 sqrt(n) <=-0.84 rarr n>=ceil(1.5^2) rarr n>=3$
non trovi?
PS: il grafico l'ho fatto apposta per farti capire il problema....

Hai perfettamente ragione, non ho assolutamente idea del perchè ho standardizzato solo il primo fattore
Ora sì che è tutto chiaro. Grazie infinite!

Ora sì che è tutto chiaro. Grazie infinite!