Esercizio su verifica di ipotesi - Nuovo dentifricio
Buonasera a tutti!! Ho per voi un esercizio che mi sta mettendo in difficoltà:
"Il messaggio pubblicitario di un nuovo dentifricio afferma che esso è in grado di ridurre la frequenza delle carie dei bambini negli anni in cui ne sono soggetti.
Supponiamo che il numero di carie all'anno per un bambino di quell'età abbia distribuzione con media 3 e varianza 1,
e che uno studio dell'efficacia del nuovo prodotto, condotto su 2500 bambini, abbia rivelato un numero medio di carie all'anno pari a 2,95. Ipotizziamo che la varianza usando il dentifricio reclamizzato non sia diversa da quella naturale.
Questi dati sono abbastanza forti da convalidare al 5% di significatività l'annuncio pubblicitario?"
Quindi, io direi che la mia ipotesi $0$ è l'ipotesi nella quale suppongo che il dentifricio effettivamente riduca il numero di carie. Per cui:
$alpha= 0,05$
$H_o : mu = mu_0< 3$
$H_1 : mu >=3$
La zona di rifiuto sarà delimitata dal valore
$z_alpha= z_(0,05)= 1,64$
Quindi la zona di rifiuto è : $R = {z in RR : z>1,64}$
il mio $z_t$ sarà:
$z_t= (bar(x) - mu_0)/(sqrt(sigma^2/n))$
Problema:
In questo caso $mu_0$ non è uguale ad un singolo valore, ma ad un intervallo di valori con estremo destro non compreso!
Questo intervallo è infatti uguale a $mu_0 in [0;3)$ .
Sostituire $3$ al posto di $mu_0$ in $z_t$ sarebbe quindi sbagliato.
Voi cosa fareste? avete qualche consiglio da darmi?
"Il messaggio pubblicitario di un nuovo dentifricio afferma che esso è in grado di ridurre la frequenza delle carie dei bambini negli anni in cui ne sono soggetti.
Supponiamo che il numero di carie all'anno per un bambino di quell'età abbia distribuzione con media 3 e varianza 1,
e che uno studio dell'efficacia del nuovo prodotto, condotto su 2500 bambini, abbia rivelato un numero medio di carie all'anno pari a 2,95. Ipotizziamo che la varianza usando il dentifricio reclamizzato non sia diversa da quella naturale.
Questi dati sono abbastanza forti da convalidare al 5% di significatività l'annuncio pubblicitario?"
Quindi, io direi che la mia ipotesi $0$ è l'ipotesi nella quale suppongo che il dentifricio effettivamente riduca il numero di carie. Per cui:
$alpha= 0,05$
$H_o : mu = mu_0< 3$
$H_1 : mu >=3$
La zona di rifiuto sarà delimitata dal valore
$z_alpha= z_(0,05)= 1,64$
Quindi la zona di rifiuto è : $R = {z in RR : z>1,64}$
il mio $z_t$ sarà:
$z_t= (bar(x) - mu_0)/(sqrt(sigma^2/n))$
Problema:
In questo caso $mu_0$ non è uguale ad un singolo valore, ma ad un intervallo di valori con estremo destro non compreso!
Questo intervallo è infatti uguale a $mu_0 in [0;3)$ .
Sostituire $3$ al posto di $mu_0$ in $z_t$ sarebbe quindi sbagliato.
Voi cosa fareste? avete qualche consiglio da darmi?
Risposte
E' vietato inserire l'immagine al posto del testo[nota]art 3.6 del regolamento (e c'è un valido motivo per questo, non è una fisima dei moderatori)[/nota]....ti prego di modificare il messaggio.
Comunque:
1) hai scritto male il sistema di ipotesi
2) Nel sistema corretto $H_0: mu>=3$ e coincide con $mu=3$. Il perché è chiaramente spiegato qui
3) come conseguenza del punto 1) la regione di rifiuto è errata
Come risolvere il problema in due mosse senza tante pippe?
Una gaussiana standar ha un dominio che (anche se diciamo che è $RR$) in realtà è $z in (-3.3;3.3)$...al di fuori di questo range è tutto zero....
la tua statistica test viene
$(2.95-3)xx50=-2.5$
quindi rifiuti....perché $-2.5<-1.64$
Comunque:
1) hai scritto male il sistema di ipotesi
2) Nel sistema corretto $H_0: mu>=3$ e coincide con $mu=3$. Il perché è chiaramente spiegato qui
3) come conseguenza del punto 1) la regione di rifiuto è errata
Come risolvere il problema in due mosse senza tante pippe?
Una gaussiana standar ha un dominio che (anche se diciamo che è $RR$) in realtà è $z in (-3.3;3.3)$...al di fuori di questo range è tutto zero....
la tua statistica test viene
$(2.95-3)xx50=-2.5$
quindi rifiuti....perché $-2.5<-1.64$
"tommik":
E' vietato inserire l'immagine al posto del testo[nota]art 3.6 del regolamento (e c'è un valido motivo per questo, non è una fisima dei moderatori)[/nota]....ti prego di modificare il messaggio.
Fatto tommik! Scusa, mi ero dimenticato.
benissimo....ora metto qualche riga in più (wait please)
"tommik":
2) Nel sistema corretto $H_0: mu>=3$ e coincide con $mu=3$. Il perché è chiaramente spiegato qui
Inoltre non capisco il perché del punto 2... Ho provato a leggere il post, ma si parla di $text(p-value)$, che, purtroppo, non conosco..
P.s. Sìsì tranquillo non ho nessuna fretta (:
Per scrivere bene un sistema di ipotesi occorre leggere bene TUTTO il testo (ed è per questo che si richiede di scrivere sempre tutto il testo del problema)
Un test di verifica delle ipotesi ha senso solo se i dati sperimentali "danno torto" all'ipotesi di lavoro.
"il messaggio pubblicitario dice che il dentifricio riduce le carie" ed in effetti i dati sperimentali ci danno ragione....le carie sono passate da 3 (media storica) a 2.95.
ora la domanda è 2.95 è davvero minore di 3 oppure no?
Per rispondere scriviamo il sistema di ipotesi
${{: ( H_0:mu>=3 ),( H_1:mu<3 ) :}$
Per la definizione di $alpha$
$alpha=S u p_(theta in Theta_0)pi(theta)$
il sistema di ipotesi che ho scritto è equivalente a questo
${{: ( H_0:mu=3 ),( H_1:mu<3 ) :}$
Se non ti è chiaro quanto ho scritto nel link o fai un atto di fede oppure mi tocca cercare qualche dispensa più elementare....
a questo punto è evidente che la tua statistica test è
$(2.95-3)/1 sqrt(2500)=-2.5$
il p-value è la $Phi(-2.5)=0.006$
più il pvalue è piccolo più si rifiuta....ma anche come fai tu, basta che confronti $-2.5$ con $-1.64$ e giungi alla stessa conclusione
questa non è proprio l'approccio che preferisco per questo tipo di problemi ma ti assicuro che è fatta bene ed è scritta in modo non elementare....molto più che elementare.
La spiegazione che ti interessa sta alle pagine 29 e 30. Se non la capisci ovviamente devi andare indietro
Il mio consiglio è ovviamente quello di perdere pure un'oretta a leggerla tutta, soprattutto la parte descrittiva del problema e ti dovrebbe chiarire parecchio le cose.
Non sono un prof ma ho molti anni di esperienza...
Un test di verifica delle ipotesi ha senso solo se i dati sperimentali "danno torto" all'ipotesi di lavoro.
"il messaggio pubblicitario dice che il dentifricio riduce le carie" ed in effetti i dati sperimentali ci danno ragione....le carie sono passate da 3 (media storica) a 2.95.
ora la domanda è 2.95 è davvero minore di 3 oppure no?
Per rispondere scriviamo il sistema di ipotesi
${{: ( H_0:mu>=3 ),( H_1:mu<3 ) :}$
Per la definizione di $alpha$
$alpha=S u p_(theta in Theta_0)pi(theta)$
il sistema di ipotesi che ho scritto è equivalente a questo
${{: ( H_0:mu=3 ),( H_1:mu<3 ) :}$
Se non ti è chiaro quanto ho scritto nel link o fai un atto di fede oppure mi tocca cercare qualche dispensa più elementare....
a questo punto è evidente che la tua statistica test è
$(2.95-3)/1 sqrt(2500)=-2.5$
il p-value è la $Phi(-2.5)=0.006$
più il pvalue è piccolo più si rifiuta....ma anche come fai tu, basta che confronti $-2.5$ con $-1.64$ e giungi alla stessa conclusione
questa non è proprio l'approccio che preferisco per questo tipo di problemi ma ti assicuro che è fatta bene ed è scritta in modo non elementare....molto più che elementare.
La spiegazione che ti interessa sta alle pagine 29 e 30. Se non la capisci ovviamente devi andare indietro
Il mio consiglio è ovviamente quello di perdere pure un'oretta a leggerla tutta, soprattutto la parte descrittiva del problema e ti dovrebbe chiarire parecchio le cose.
Non sono un prof ma ho molti anni di esperienza...

"tommik":
${{: ( H_0:mu>=3 ),( H_1:mu<3 ) :}$
tommik buonasera!
Sono d'accordo su tutto, però non riesco a comprendere questo passaggio che ho citato.
Nella tua ipotesi $H_0$, hai ipotizzato che il dentifricio non funzioni, o che addirittura peggiori la situazione.
Nell'ipotesi $H_1$ hai invece supposto che il dentifricio funzioni.
Seppure il fatto di impostare una come $H_0$ e l'altra come $H_1$ possa sembrare arbitrario, non è affatto così, perché otterrei due risultati diversi a seconda della scelta fatta.
Perché?
- Se infatti avessi impostato il problema come lo hai impostato tu, avrei ottenuto:
$R_(text(tommik))={z_(test)
$-2,5<-1,64$
da cui segue che rifiuto in quanto $z_(test) in R_(text(tommik))$
- Impostandolo come lo ho impostato io, avrei ottenuto:
$R_(text(Nine))={z_(test)>z_(alpha)}$
dove $z_(test)=-2,5$ e $z_(alpha)=+1,64$.
da cui segue che accetterei in quanto
$z_(test)$non appartiene a $ R_(text(Nine))$.
La scelta non è dunque arbitraria.
Incomincio di sicuro a studiare quanto da te consigliato. Se potessi fare chiarezza sul suddetto punto che non mi è chiaro, te ne sarei grato tommik.
Questo è proprio il punto cruciale da capire prima di impostare il sistema. Tutta la teoria di prova delle ipotesi si costruisce partendo da qui...se non è chiaro è meglio che te lo chiarisci, altrimenti sarà un bagno di sangue.
Tieni presente che è un argomento di logica piuttosto avanzato...occorre prenderci un po' la mano ed entrare nel giusto modo di pensare.
Se i dati sperimentali (in questo caso la media campionaria) fossero d'accordo con l'ipotesi di lavoro, ovvero avessimo ad esempio $bar(x)=3.3$ allora non ci sarebbe nulla da provare.
Siamo nella seguente situazione: abbiamo un dentifricio che funziona bene, con media di carie pari a 3. Esce un nuovo dentrifricio con media 3.3...lo possiamo buttare e continuare ad usare il vecchio...non trovi?
Detto in termini un po' più formali, anche i dati sperimentali del nuovo dentrifricio avvalorano l'ipotesi di lavoro: il vecchio dentifricio è migliore del nuovo. Punto.
Le due ipotesi non sono sullo stesso piano; l'ipotesi di lavoro ($H_0$) gioca un ruolo privilegiato: è sempre vera finché non viene falsificata dai dati..
Quindi se la media è $2.95$ significa che i dati sperimentali dicono che il nuovo dentifricio è migliore. L'unico sistema di ipotesi che ha senso è quello che ho scritto io.
Il test serve per vedere se quel meno 0.05 si può considerare significativo oppure no.
Leggi bene quella dispensina tralasciando le formule ma concentrandoti solo sulle parti descrittive (vedrai che avrai delle belle sorprese....)
Tieni presente che è un argomento di logica piuttosto avanzato...occorre prenderci un po' la mano ed entrare nel giusto modo di pensare.
Se i dati sperimentali (in questo caso la media campionaria) fossero d'accordo con l'ipotesi di lavoro, ovvero avessimo ad esempio $bar(x)=3.3$ allora non ci sarebbe nulla da provare.
Siamo nella seguente situazione: abbiamo un dentifricio che funziona bene, con media di carie pari a 3. Esce un nuovo dentrifricio con media 3.3...lo possiamo buttare e continuare ad usare il vecchio...non trovi?
Detto in termini un po' più formali, anche i dati sperimentali del nuovo dentrifricio avvalorano l'ipotesi di lavoro: il vecchio dentifricio è migliore del nuovo. Punto.
Le due ipotesi non sono sullo stesso piano; l'ipotesi di lavoro ($H_0$) gioca un ruolo privilegiato: è sempre vera finché non viene falsificata dai dati..
Quindi se la media è $2.95$ significa che i dati sperimentali dicono che il nuovo dentifricio è migliore. L'unico sistema di ipotesi che ha senso è quello che ho scritto io.
Il test serve per vedere se quel meno 0.05 si può considerare significativo oppure no.
Leggi bene quella dispensina tralasciando le formule ma concentrandoti solo sulle parti descrittive (vedrai che avrai delle belle sorprese....)
"tommik":
Se i dati sperimentali (in questo caso la media campionaria) fossero d'accordo con l'ipotesi di lavoro, ovvero avessimo ad esempio $bar(x)=3.3$ allora non ci sarebbe nulla da provare.
Siamo nella seguente situazione: abbiamo un dentifricio che funziona bene, con media di carie pari a 3. Esce un nuovo dentrifricio con media 3.3...lo possiamo buttare e continuare ad usare il vecchio...non trovi?
Detto in termini un po' più formali, anche i dati sperimentali del nuovo dentrifricio avvalorano l'ipotesi di lavoro: il vecchio dentifricio è migliore del nuovo. Punto.
...Quindi se la media è $2.95$ significa che i dati sperimentali dicono che il nuovo dentifricio è migliore. L'unico sistema di ipotesi che ha senso è quello che ho scritto io.
Premetto che mi sto sentendo stupido come un opossum.
Qui allora il problema non è di statistica, ma di logica, direi ancora peggio, di comprensione del testo.
Dico questo perché oggi ho fatto più di una ventina di esercizi sulla verifica di ipotesi e non ho commesso mezzo errore.
Potrei nascondermi dalla vergogna, ma decido di andare avanti e continuare a scavare per fare luce.
Scusa, ma la nostra ipotesi non è quella che il nuovo dentifricio funzioni meglio del precedente?
La media $mu$ rappresenta il numero di carie che un bambino ha in un determinato anno di vita.
Se il dentifricio funziona meglio, allora il numero di carie dovrebbe essere minore di 3, no?
Nell'ipotesi di lavoro, $H_0$, non dovresti ipotizzare che il tuo dentifricio funziona meglio del precedente, e quindi dire che la media $mu$ sia minore di 3?
i dati sperimentali devono essere compatibili con l'ipotesi alternativa.
Prima di chiudere il discorso ti faccio solo notare che ti avevo già spiegato la questione qui
tu cosa faresti? confronteresti lo z osservato $-2.5$ con il valore critico $+1.64$?? Allora non avevi capito nulla nemmeno nel caso del link....è esattamente lo stesso problema solo che lì il testo ti dava lui il sistema da sottoporre a verifica qui invece il sistema lo devi scrivere tu. Se hai capito il funzionamento riesci a scrivere il sistema altrimenti no. Ovviamente è un problema di comprensione del testo come in TUTTI gli esercizi di probabilità e di logica
Comunque mi arrendo
Prima di chiudere il discorso ti faccio solo notare che ti avevo già spiegato la questione qui
tu cosa faresti? confronteresti lo z osservato $-2.5$ con il valore critico $+1.64$?? Allora non avevi capito nulla nemmeno nel caso del link....è esattamente lo stesso problema solo che lì il testo ti dava lui il sistema da sottoporre a verifica qui invece il sistema lo devi scrivere tu. Se hai capito il funzionamento riesci a scrivere il sistema altrimenti no. Ovviamente è un problema di comprensione del testo come in TUTTI gli esercizi di probabilità e di logica
Comunque mi arrendo

"tommik":
i dati sperimentali devono essere compatibili con l'ipotesi alternativa.

"tommik":
i dati sperimentali devono essere compatibili con l'ipotesi alternativa.
Okay quindi quando imposto il problema, devo impostare $H_1$ concorde con i dati sperimentali.
$H_0$ viene definita di conseguenza.
"tommik":
Comunque mi arrendo
Tranquillo tommik hai fatto già abbastanza!!
Ora sta a me studiare in maniera approfondita.