Verifica ipotesi
Esercizio:
La distribuzione della spesa per cliente di un certo supermercato può essere ben
approssimata da una normale con media pari a 150 euro. Nelle vicinanze viene costruito un nuovo
supermercato avente le stesse caratteristiche. Per un campione casuale di 49 clienti del nuovo
supermercato, si rileva una spesa media pari a 150.50 euro e una varianza corretta pari a 4 euro. Sulla
base di questi dati possiamo concludere, ad un livello di significatività α = 0.05, che nel nuovo
supermercato la spesa media è diversa del vecchio?
So come risolverlo, non mi è chiara una cosa. Avendo una varianza ignota, in teoria l'esercizio andrebbe risolto con la T-student. Non capisco perchè nelle soluzioni, invece di trovare il valore di 0.05 nella T student (n -1 ovvero 49-1), standardizzi, dicendo che questo valore è uguale a Z0.975. Come fa a dire ciò? Perchè preferisce usare la standard invece che il T-Student?
La distribuzione della spesa per cliente di un certo supermercato può essere ben
approssimata da una normale con media pari a 150 euro. Nelle vicinanze viene costruito un nuovo
supermercato avente le stesse caratteristiche. Per un campione casuale di 49 clienti del nuovo
supermercato, si rileva una spesa media pari a 150.50 euro e una varianza corretta pari a 4 euro. Sulla
base di questi dati possiamo concludere, ad un livello di significatività α = 0.05, che nel nuovo
supermercato la spesa media è diversa del vecchio?
So come risolverlo, non mi è chiara una cosa. Avendo una varianza ignota, in teoria l'esercizio andrebbe risolto con la T-student. Non capisco perchè nelle soluzioni, invece di trovare il valore di 0.05 nella T student (n -1 ovvero 49-1), standardizzi, dicendo che questo valore è uguale a Z0.975. Come fa a dire ciò? Perchè preferisce usare la standard invece che il T-Student?
Risposte
risolto con la t di Student è più corretto! con 48 gradi di libertà il valore critico si avvicina di molto alla normale...per cui si possono usare entrambi i metodi
Si ma scusami, se io lo risolvo con la t di student il valore che mi viene fuori è t48;0,05 = 1,68. Per quale motivo a lei viene Z0,975= 1,96?
"ManuelaBarton":
La distribuzione della spesa per cliente di un certo supermercato è normale con media 150 . .... Sulla
base di questi dati possiamo concludere, ad un livello di significatività α = 0.05, che nel nuovo
supermercato la spesa media è DIVERSA del vecchio
quindi le ipotesi sono queste:
${{: ( H_(0):mu=150 ),(H_(1):mu!=150 ) :}$
come vedi l'ipotesi alternativa è bilaterale, per cui il test avrà la seguente regione di rifiuto
$|t_(stat)|>t_(1-alpha/2)$
e quindi devi andare sulle tavole a cercare il valore critico $alpha/2=0,025$
con una tabella come quella in figura....a "lei" verrebbe $1,96$ mentre a te (50 gdl, dato che 48 non ce li ho) $2,009$
(quindi pìù o meno lo stesso risultato)
chiaro?

Allora penso di non aver minimamente capito come funziona la verifica di ipotesi. Fino ad H0 e H1 ci ero arrivata, poi il mio libro la pone in maniera diversa. Mi dice che mi devo trovare il valore critico a, non mi dice come, mi dice soltanto che se la varianza è nota devo usare la standard se la varianza è ignota la t student. Inoltre non mi parla di regioni di rifiuto ma di regioni critiche. E se dovessi applicare quello che mi dice il libro, mi da come regione critica (non ho capito se critica e di rifiuto sono la stessa cosa) un sistema con X(medio) < o uguale di U0 - / + Z a/2 per la radice della varianza/n.
supponiamo tu abbia capito che tipo di statistiche calcolare nei vari casi:
prova delle ipotesi sulla media della normale con varianza nota
prova delle ipotesi sulla media della normale con varianza non nota
prova delle ipotesi sulla varianza della normale con media non nota
prova delle ipotesi sulla varianza della normale con media nota
prova delle ipotesi sulla proporzione (sul parametro $pi$ della bernulli)
Prima di tutto scrivi bene il sistema di ipotesi: per fare ciò leggi bene il testo e traducilo in formule....e poi accordi la regione di rifiuto con lo stesso segno dell'ipotesi alternativa....
quindi se l'alternativa è $H_(1):mu>mu_(0)$....allora anche la regione di rifiuto sarà $Z_(stat)>Z_(alpha)$
se l'ipotesi alternativa è bilaterale...dovrai dividere anche il livello di significatività...metà alla coda di sinstra e metà alla coda di destra
prova delle ipotesi sulla media della normale con varianza nota
prova delle ipotesi sulla media della normale con varianza non nota
prova delle ipotesi sulla varianza della normale con media non nota
prova delle ipotesi sulla varianza della normale con media nota
prova delle ipotesi sulla proporzione (sul parametro $pi$ della bernulli)
Prima di tutto scrivi bene il sistema di ipotesi: per fare ciò leggi bene il testo e traducilo in formule....e poi accordi la regione di rifiuto con lo stesso segno dell'ipotesi alternativa....
quindi se l'alternativa è $H_(1):mu>mu_(0)$....allora anche la regione di rifiuto sarà $Z_(stat)>Z_(alpha)$
se l'ipotesi alternativa è bilaterale...dovrai dividere anche il livello di significatività...metà alla coda di sinstra e metà alla coda di destra
Quindi quando ho varianza nota:
H1 : u < u0 ho come regione di rifiuto Z <(uguale) - Za
H1 : u > u0 Z >(uguale) Za
H1 : u diverso u0 |z| >(ugale) Za/2
Quando la varianza è ignota
H1 : u < u0 T < t1-a
H1 : u > u0 T> t1-a
H1 : u diverso u0 |T| > T1-a/2
Mi confermi ?
H1 : u < u0 ho come regione di rifiuto Z <(uguale) - Za
H1 : u > u0 Z >(uguale) Za
H1 : u diverso u0 |z| >(ugale) Za/2
Quando la varianza è ignota
H1 : u < u0 T < t1-a
H1 : u > u0 T> t1-a
H1 : u diverso u0 |T| > T1-a/2
Mi confermi ?
sì confermo....a parte ovviamente qualche imprecisione nella notazione
$t_(1-alpha/2)$, $t_(alpha/2)$
nota:
su alcuni testi puoi trovare $s/sqrt(n-1)$ mentre su altri $s/sqrt(n)$....dipende se la varianza campionaria è quella distorta o quella corretta, rispettivamente....in questa tabella si fa riferimento alla varianza campionaria distorta
$t_(1-alpha/2)$, $t_(alpha/2)$
nota:
su alcuni testi puoi trovare $s/sqrt(n-1)$ mentre su altri $s/sqrt(n)$....dipende se la varianza campionaria è quella distorta o quella corretta, rispettivamente....in questa tabella si fa riferimento alla varianza campionaria distorta
Ok perfetto, mi sono fatta un bel po' di esercizi e devo dire tutto ok. Ho trovato giusto qualche difficoltà su questo.
In uno studio di marketing viene misurato il grado di soddisfazione dei clienti di un
determinato prodotto. Supponiamo che il gradimento si distribuisca nella popolazione come una v.c.
Normale con varianza nota pari a σ2 = 9. Sulla base di un campione di 20 clienti, si vuole verificare
l’ipotesi nulla che il grado di soddisfazione medio sia uguale a μ = 8 contro l’ipotesi alternativa che sia
inferiore. Calcolare la probabilità di commettere un errore del II tipo considerando che μ1 = 7 e α =
0.05.
Allora innanzitutto io so che errore di 2 tipo significa: non rifiutare l'ipotesi nulla anche se falsa.
Il primo passo che faccio è trovarmi la Z0,05 = -1,645
Poi mi trovo la X media della media campionaria quindi: X <(uguale) 8 - 1,645 x 3/4,47 = 6,90
Quindi so che la regione di accettazione si trova in ogni valore maggiore di 6,90.
Ora non ho capito, sapendo queste cose, cosa devo trovarmi? Cioè non ho capito nella pratica come calcolo la probabilità di commettere l'errore di 2 tipo...
In uno studio di marketing viene misurato il grado di soddisfazione dei clienti di un
determinato prodotto. Supponiamo che il gradimento si distribuisca nella popolazione come una v.c.
Normale con varianza nota pari a σ2 = 9. Sulla base di un campione di 20 clienti, si vuole verificare
l’ipotesi nulla che il grado di soddisfazione medio sia uguale a μ = 8 contro l’ipotesi alternativa che sia
inferiore. Calcolare la probabilità di commettere un errore del II tipo considerando che μ1 = 7 e α =
0.05.
Allora innanzitutto io so che errore di 2 tipo significa: non rifiutare l'ipotesi nulla anche se falsa.
Il primo passo che faccio è trovarmi la Z0,05 = -1,645
Poi mi trovo la X media della media campionaria quindi: X <(uguale) 8 - 1,645 x 3/4,47 = 6,90
Quindi so che la regione di accettazione si trova in ogni valore maggiore di 6,90.
Ora non ho capito, sapendo queste cose, cosa devo trovarmi? Cioè non ho capito nella pratica come calcolo la probabilità di commettere l'errore di 2 tipo...
Se la regione di accettazione è x> 6,9 (non ho controllato) allora per calcolare b basta fare
$ P (X> 6,9|H_(1)) $
Rifai la standardizzazione ma stavolta con $ mu_(1) $ e non $mu_(0) $
Quindi
$ P (Z>(6,9-7)/(3/sqrt (20)))=P (Z> -0,15)=P (Z <0,15) $
ho fatto i conti a mente. ..spero non ci siano errori
$ P (X> 6,9|H_(1)) $
Rifai la standardizzazione ma stavolta con $ mu_(1) $ e non $mu_(0) $
Quindi
$ P (Z>(6,9-7)/(3/sqrt (20)))=P (Z> -0,15)=P (Z <0,15) $
ho fatto i conti a mente. ..spero non ci siano errori
Esatto! Anche io sono arrivato a questo punto, dopo di chè il libro da questa come soluzione:
(Z<0.15)=0.5596. Perchè?
(Z<0.15)=0.5596. Perchè?