Determinare stimatore, standard error, valori di stima.
Salve a tutti.
Ho qualche difficoltà con la statistica inferenziale.
Il mio tentativo di risoluzione è questo.
poichè è un modello bernoulliano la media è la probabilità:
p(cappello) = media campionaria = 160/200 = 0.8
se(p) = $sqrt(var(p))$ = $sqrt(p(1-p))$ = $sqrt(0.16)$ = 0.4
Per quanto riguarda i valori di stima non capisco a cosa si faccia riferimento.
Poi controllo se l'ipotesi è ragionevole: H0: $\mu$=0.9
Z(x) = $(0.8-0.9)/ sqrt(0.16/200)$ = -3.53 che è fuori dall'intervallo normale perchè il valore di alfa è +- 2.575, quindi rifiuto l'ipotesi di partenza.
Se c'è qualcuno con cui possa confrontarmi, gliene sarei grato!
Ho qualche difficoltà con la statistica inferenziale.
Una ditta farmaceutica reclamizza una prodotto cosmetico la cui efficacia è assicurata nel
90% dei casi. Per vericare la veridicità di quanto affermato, si estrae un campione casuale
semplice di 200 individui a cui viene somministrato il prodotto. Alla fine della sperimentazione
si è verificato che il prodotto è risultato effcace per 160 individui. Si definisca un opportuno
stimatore per la probabilità che il prodotto sia efface, si determini l'associato standard error
e si calcolino i corrispondenti valori di stima. Inoltre, utilizzando un opportuno test con livello
di signicatività (approssimato) alfa = 0,01, si verichi l'ipotesi che quanto affermato dalla casa
farmaceutica sia ragionevole, a fronte di un'alternativa unilaterale sinistra.
Il mio tentativo di risoluzione è questo.
poichè è un modello bernoulliano la media è la probabilità:
p(cappello) = media campionaria = 160/200 = 0.8
se(p) = $sqrt(var(p))$ = $sqrt(p(1-p))$ = $sqrt(0.16)$ = 0.4
Per quanto riguarda i valori di stima non capisco a cosa si faccia riferimento.
Poi controllo se l'ipotesi è ragionevole: H0: $\mu$=0.9
Z(x) = $(0.8-0.9)/ sqrt(0.16/200)$ = -3.53 che è fuori dall'intervallo normale perchè il valore di alfa è +- 2.575, quindi rifiuto l'ipotesi di partenza.
Se c'è qualcuno con cui possa confrontarmi, gliene sarei grato!
Risposte
Eccomi pronto al confronto!
Ci sono diverse cose che non vanno.....vediamole con calma
lo standard error è il denominatore che hai messo nel test, ovvero la stima della varianza della media: $sqrt((hat(p)(1-hat(p)))/n)$
I valori di stima a cui si fa riferimento è l'intervallo di confidenza: stimatore puntuale, $hat(p)$ $+-$ lo standard error moltiplicato per un opportuno indice di copertura $z_(alpha/2)$ con $alpha$ che, non essendo specificato, lo puoi scegliere tu...oppure puoi usare l'$alpha$ del punto successivo[nota]usualmente si utilizza $alpha=5%$, oppure $1%$ per un livello di significatività alto[/nota]
Il test è errato ma il risultato giusto
Il test giusto è questo
$(hat(p)-p_0)/(sqrt((p_0(1-p_0))/n))=(0.8-0.9)/sqrt((0.9*0.1)/200)=-4.71$
e ciò in quanto la regione di rifiuto è definita come $P{ul(X) in C|H_0}=alpha$ quindi i calcoli vanno fatto sotto l'ipotesi che la media sia quella dell'ipotesi nulla, $0.9$ e di conseguenza la varianza sotto $H_0$ è $0.9xx0.1$
Il fatto che nell'intervallo di confidenza si usi l'altro valore è perché l'intervallo di confidenza così calcolato non è quello corretto ma è un'approssimazione dell'approssimazione che però viene comoda per la sua semplicità. Trovi tutti i dettagli ed approfondimenti QUI
Quindi correttamente si rifiuta l'ipotesi che l'efficacia sia del 90% ma hai fatto un altro errorino....a livello di significatività del 1% con un test unilaterale il valore critico è $Phi^(-1)(0.01)=-2.33$ tu invece hai calcolato $z_(alpha/2)$, come se il test fosse bilaterale
Sono stati postati diversi esercizi in questi giorni sullo stesso argomento dall'utente @albertocorra
Tutti risolti e commentati....guardali che ti saranno sicuramente molto utili
PS: per digitare "p cappello", in modo molto naturale, basta fare hat(p) fra i simboli del dollaro.
ciao ciao
Ci sono diverse cose che non vanno.....vediamole con calma
lo standard error è il denominatore che hai messo nel test, ovvero la stima della varianza della media: $sqrt((hat(p)(1-hat(p)))/n)$
I valori di stima a cui si fa riferimento è l'intervallo di confidenza: stimatore puntuale, $hat(p)$ $+-$ lo standard error moltiplicato per un opportuno indice di copertura $z_(alpha/2)$ con $alpha$ che, non essendo specificato, lo puoi scegliere tu...oppure puoi usare l'$alpha$ del punto successivo[nota]usualmente si utilizza $alpha=5%$, oppure $1%$ per un livello di significatività alto[/nota]
Il test è errato ma il risultato giusto
Il test giusto è questo
$(hat(p)-p_0)/(sqrt((p_0(1-p_0))/n))=(0.8-0.9)/sqrt((0.9*0.1)/200)=-4.71$
e ciò in quanto la regione di rifiuto è definita come $P{ul(X) in C|H_0}=alpha$ quindi i calcoli vanno fatto sotto l'ipotesi che la media sia quella dell'ipotesi nulla, $0.9$ e di conseguenza la varianza sotto $H_0$ è $0.9xx0.1$
Il fatto che nell'intervallo di confidenza si usi l'altro valore è perché l'intervallo di confidenza così calcolato non è quello corretto ma è un'approssimazione dell'approssimazione che però viene comoda per la sua semplicità. Trovi tutti i dettagli ed approfondimenti QUI
Quindi correttamente si rifiuta l'ipotesi che l'efficacia sia del 90% ma hai fatto un altro errorino....a livello di significatività del 1% con un test unilaterale il valore critico è $Phi^(-1)(0.01)=-2.33$ tu invece hai calcolato $z_(alpha/2)$, come se il test fosse bilaterale
Sono stati postati diversi esercizi in questi giorni sullo stesso argomento dall'utente @albertocorra
Tutti risolti e commentati....guardali che ti saranno sicuramente molto utili
PS: per digitare "p cappello", in modo molto naturale, basta fare hat(p) fra i simboli del dollaro.
ciao ciao
Intanto grazie per la rapidità.
Io so che la varianza di questo modello è n(1-p) e nel caso (cioè questo) di più variabili è np(-1p)
1)Perchè utilizzo la prima e non la seconda formula?
2) lo standard error è la radice quadrata del eqm, che nel nostro caso equivale alla varianza. Ma la varianza non ce l'abbiamo, quindi dobbiamo utilizzare la formula per la varianza campionaria. Corretto?
Inoltre, da quello che ho inteso per la verifica di ipotesi, la standardizzazione cambia a seconda se cerchiamo un ipotesi unilaterale o sinistra/destra oppure in ogni caso devo dividere per la varianza di Po e non $hat(p)$? Perché fra i miei appunti trovo solo una formula, che è quella che ho usato.
Grazie mille!
Io so che la varianza di questo modello è n(1-p) e nel caso (cioè questo) di più variabili è np(-1p)
1)Perchè utilizzo la prima e non la seconda formula?
2) lo standard error è la radice quadrata del eqm, che nel nostro caso equivale alla varianza. Ma la varianza non ce l'abbiamo, quindi dobbiamo utilizzare la formula per la varianza campionaria. Corretto?
Inoltre, da quello che ho inteso per la verifica di ipotesi, la standardizzazione cambia a seconda se cerchiamo un ipotesi unilaterale o sinistra/destra oppure in ogni caso devo dividere per la varianza di Po e non $hat(p)$? Perché fra i miei appunti trovo solo una formula, che è quella che ho usato.
Grazie mille!
Affinché tutti possano capire e non fraintendere (me compreso) dovresti scrivere le formule in modo completo e per bene....nel tuo messaggio c'è un po' un mix di tutto e ciò confonde chi legge.
La varianza del modello è questa $sigma^2=p(1-p)$ perché il modello è bernulliano. Da ciò scende che la varianza della media campionaria è, come dovresti sapere, $sigma^2/n$ . Non conoscendo la varianza la si stima; in altre parole, l'errore standard, ovvero, in questo caso, la varianza (stimata) della media è proprio $(hat(p)(1-hat(p)))/n$ come ho scritto e come trovi anche sul link di wikipedia che ti ho indicato
Per quanto riguarda le ipotesi uni o bi-laterali la standardizzazione è sempre quella. Ciò che cambia è solo il quantile da cercare sulle tavole, $z_(alpha)$ nel caso unilaterale mentre $z_(alpha/2)$ nel caso bilaterale.
Il funzionamento dell'intervallo di confidenza nel caso di proporzioni te l'ho linkato; quel post è molto molto interessante (non perché l'abbia scritto io ) dato che contiene considerazioni che difficilmente trovi sui libri di base...è un approfondimento sicuramente non necessario per il tuo esame ma ti assicuro che se lo capisci ti chiarisce un sacco di cose.
3) il test per la proporzione invece è tutt'altra faccenda, si basa sul teorema del limite centrale e qindi giocoforza devi usare il parametro $p_0$. In parole molto semplici, si dimostra che lo stimatore di massima verosimiglianza (in questo caso il tuo $hat(p)$) asintoticamente si distribuisce come una Gaussiana, di media $p$ e varianza $(p(1-p))/n$
Quindi, SE E' VERA L'IPOTESI NULLA, ovvero se $p=p_0=0.9$ nel tuo test, $(hat(p)-p_0)/sqrt((p_0(1-p_0))/n)~ N(0;1)$
Questa formula ti assicuro che la trovi dovunque: i.e.

PS: l'argomento in questione è di importanza fondamentale, non limitarti a leggere gli appunti ma studia dei libri di testo completi, IMHO
La varianza del modello è questa $sigma^2=p(1-p)$ perché il modello è bernulliano. Da ciò scende che la varianza della media campionaria è, come dovresti sapere, $sigma^2/n$ . Non conoscendo la varianza la si stima; in altre parole, l'errore standard, ovvero, in questo caso, la varianza (stimata) della media è proprio $(hat(p)(1-hat(p)))/n$ come ho scritto e come trovi anche sul link di wikipedia che ti ho indicato
Per quanto riguarda le ipotesi uni o bi-laterali la standardizzazione è sempre quella. Ciò che cambia è solo il quantile da cercare sulle tavole, $z_(alpha)$ nel caso unilaterale mentre $z_(alpha/2)$ nel caso bilaterale.
Il funzionamento dell'intervallo di confidenza nel caso di proporzioni te l'ho linkato; quel post è molto molto interessante (non perché l'abbia scritto io ) dato che contiene considerazioni che difficilmente trovi sui libri di base...è un approfondimento sicuramente non necessario per il tuo esame ma ti assicuro che se lo capisci ti chiarisce un sacco di cose.
3) il test per la proporzione invece è tutt'altra faccenda, si basa sul teorema del limite centrale e qindi giocoforza devi usare il parametro $p_0$. In parole molto semplici, si dimostra che lo stimatore di massima verosimiglianza (in questo caso il tuo $hat(p)$) asintoticamente si distribuisce come una Gaussiana, di media $p$ e varianza $(p(1-p))/n$
Quindi, SE E' VERA L'IPOTESI NULLA, ovvero se $p=p_0=0.9$ nel tuo test, $(hat(p)-p_0)/sqrt((p_0(1-p_0))/n)~ N(0;1)$
Questa formula ti assicuro che la trovi dovunque: i.e.

PS: l'argomento in questione è di importanza fondamentale, non limitarti a leggere gli appunti ma studia dei libri di testo completi, IMHO