Statistica Test
Un’azienda produce motori elettrici e, storicamente, gli interventi in garanzia riguardano il 7.5% della produzione. Viene acquistato un nuovo macchinario che si ritiene vada a ridurre questa percentuale. Allo scadere del periodo di garanzia dei primi lotti prodotti col nuovo macchinario, si osserva che sulle 180 unità vendute 9 sono risultate difettose.
(a) estremi dell’intervallo di confidenza per la frazione di unità difettose prodotte dal nuovo macchinario (α = 0.05).
b) Si intende verificare se il nuovo macchinario produce meno unita difettose del precedente. Si specifichino le ipotesi nulla e alternativa per eseguire tale verifica.
(c) Si riportino gli estremi della regione di accettazione dell’ipotesi nulla per la verifica d’ipotesi di cui al punto precedente (α = 0.01).
(d) Si riporti quale tra le due ipotesi H0 e H1 si accetta sulla base dei dati osservati.
Per prima cosa mi calcolo la media $ bar(x)= 9/180= 0,05$
$ pi = 0,075 $
a) $ [bar(x) +- z_(alpha /2)* sqrt((0,05*(1-0,05)))/sqrt(180) ] $
$ z_(alpha/2) = 1,96 $
$[0,018;0,082]
b) $ H_0 : pi =pi_0 $
$ H_1 : pi
c) $ [+- z_(alpha/2)* sqrt((pi_0*(1-pi_0)) /180] $
= $[-0,0036; + 0,0036]$
d) $ Z= (0,05-0,075)/sqrt((pi_0*(1-pi_0) )/180 $
$Z=-1,27 $
$ Z_alpha= 1,64 $
$ Z<= z_alpha $ -> $-1,27 <= 1,64 $
$ H_0 $ RIFIUTO
Dal momento in cui è un tema d'esame e non ho la soluzione potreste dirmi se il mio svolgimento è corretto? Grazie!
(a) estremi dell’intervallo di confidenza per la frazione di unità difettose prodotte dal nuovo macchinario (α = 0.05).
b) Si intende verificare se il nuovo macchinario produce meno unita difettose del precedente. Si specifichino le ipotesi nulla e alternativa per eseguire tale verifica.
(c) Si riportino gli estremi della regione di accettazione dell’ipotesi nulla per la verifica d’ipotesi di cui al punto precedente (α = 0.01).
(d) Si riporti quale tra le due ipotesi H0 e H1 si accetta sulla base dei dati osservati.
Per prima cosa mi calcolo la media $ bar(x)= 9/180= 0,05$
$ pi = 0,075 $
a) $ [bar(x) +- z_(alpha /2)* sqrt((0,05*(1-0,05)))/sqrt(180) ] $
$ z_(alpha/2) = 1,96 $
$[0,018;0,082]
b) $ H_0 : pi =pi_0 $
$ H_1 : pi
c) $ [+- z_(alpha/2)* sqrt((pi_0*(1-pi_0)) /180] $
= $[-0,0036; + 0,0036]$
d) $ Z= (0,05-0,075)/sqrt((pi_0*(1-pi_0) )/180 $
$Z=-1,27 $
$ Z_alpha= 1,64 $
$ Z<= z_alpha $ -> $-1,27 <= 1,64 $
$ H_0 $ RIFIUTO
Dal momento in cui è un tema d'esame e non ho la soluzione potreste dirmi se il mio svolgimento è corretto? Grazie!
Risposte
Scusate, ho provato a correggere più volte le formule ma sono giuste.. una volta pubblicate risultano non ben visibili
si capisce poco della soluzione..ma è molto semplice
l'intervallo di confidenza è giusto
la prova delle ipotesi è un test unilaterale del tipo
${{: (H_(0): p_(0)=0.075 ),( H_(1): p_(1)<0.075 ) :}$
con $alpha=1% rarr z_(alpha)=-2.326$
quindi la regione di rifiuto è basata sulla seguente statistica
$Z_(stat)=(bar(p)-p_(0))/sqrt((p_(0)(1-p_(0)))/n)~ N(0;1)$
quindi a conti fatti la tua regione critica (regione di rifiuto) è questa:
$bar(x)<=0.075-2.326\cdot0.0196=2.93%$
essendo la media campionaria superiore al 2.93% non c'è alcuna ragione di rifiutare l'ipotesi di lavoro e quindi si conclude che il nuovo macchinario ha la stessa difettosità del vecchio. Le differenze riscontrate a livello campionario sono dovute unicamente alla variabilità della distribuzione.
PS: il quesito della regressione è chiaro? ci ho messo del tempo per rispondere eh...almeno sapere che non sia tempo buttato.....
ciao
l'intervallo di confidenza è giusto
la prova delle ipotesi è un test unilaterale del tipo
${{: (H_(0): p_(0)=0.075 ),( H_(1): p_(1)<0.075 ) :}$
con $alpha=1% rarr z_(alpha)=-2.326$
quindi la regione di rifiuto è basata sulla seguente statistica
$Z_(stat)=(bar(p)-p_(0))/sqrt((p_(0)(1-p_(0)))/n)~ N(0;1)$
quindi a conti fatti la tua regione critica (regione di rifiuto) è questa:
$bar(x)<=0.075-2.326\cdot0.0196=2.93%$
essendo la media campionaria superiore al 2.93% non c'è alcuna ragione di rifiutare l'ipotesi di lavoro e quindi si conclude che il nuovo macchinario ha la stessa difettosità del vecchio. Le differenze riscontrate a livello campionario sono dovute unicamente alla variabilità della distribuzione.
PS: il quesito della regressione è chiaro? ci ho messo del tempo per rispondere eh...almeno sapere che non sia tempo buttato.....
ciao
Il professore preferisce vedere tutti i passaggi delle formule riportate sul libro! Direi che potrebbe essere giusto no?!?
$ 0,05 + - 1,96*sqrt((0,05*(1-0,05))/180) $
$[0,018;0,082]$
$Z=-1,27$
-> $ -1,27 <= -1,64 $ Accetto
$ 0,05 + - 1,96*sqrt((0,05*(1-0,05))/180) $
$[0,018;0,082]$
$Z=-1,27$
-> $ -1,27 <= -1,64 $ Accetto
ovviamente fai come ti dice il tuo professore..
L'intervallo di confidenza è giusto.
$z_(alpha)=-1,64$ è sbagliato. Il testo richiede $alpha=0,01$ quindi $z_(alpha)=-2.326$
$Z_(stat)=-1,27$ è giusto
La conclusione è comunque corretta, appunto perché -1.27 è maggiore del valore critico (-2.326) ....
Infatti, posto $alpha=0,01$ ed essendo
$pi_(1)sei nella coda di sinistra della gaussiana...quindi rifiuti all'esterno della coda ovvero rifiuti quando $Z_(stat)<-2.326$ come si vede bene dal seguente grafico

$-1.27$ è maggiore del valore critico e quindi NON cade nella coda di sinistra; diverso sarebbe se fossi nella coda di destra...lì sì che rifiuti quando $z_(stat)>z_(1-alpha)$ ma non è questa la fattispecie!
Inoltre ti ricordo che la regola decisione può essere espressa in vari modi, tutti equivalenti
-> utilizzando l'ascissa della distribuzione tabulata (come fai tu e come ti ho mostrato in questo grafico)
-> utilizzando la statistica test (come ti ho fatto vedere io prima)
-> utlizzando il P-value
ciao
L'intervallo di confidenza è giusto.
$z_(alpha)=-1,64$ è sbagliato. Il testo richiede $alpha=0,01$ quindi $z_(alpha)=-2.326$
$Z_(stat)=-1,27$ è giusto
La conclusione è comunque corretta, appunto perché -1.27 è maggiore del valore critico (-2.326) ....
Infatti, posto $alpha=0,01$ ed essendo
$pi_(1)

$-1.27$ è maggiore del valore critico e quindi NON cade nella coda di sinistra; diverso sarebbe se fossi nella coda di destra...lì sì che rifiuti quando $z_(stat)>z_(1-alpha)$ ma non è questa la fattispecie!
Inoltre ti ricordo che la regola decisione può essere espressa in vari modi, tutti equivalenti
-> utilizzando l'ascissa della distribuzione tabulata (come fai tu e come ti ho mostrato in questo grafico)
-> utilizzando la statistica test (come ti ho fatto vedere io prima)
-> utlizzando il P-value
ciao
Ma se ho $H_0 : pi = pi_0 $
$H_1: pi< pi_0 $
non dovrei avere $ Z<= -z_alpha $ ??
$Z= -1,27 $ $Z_alpha= 2,326 $
-$-1,27 > -2,326 $ di conseguenza io direi che rifiuto .. io faccio gli stessi procedimenti che sono presenti sul mio libro di testo.. lo svolgimento del punto c) come svolto da te non l'ho mai visto
$H_1: pi< pi_0 $
non dovrei avere $ Z<= -z_alpha $ ??
$Z= -1,27 $ $Z_alpha= 2,326 $
-$-1,27 > -2,326 $ di conseguenza io direi che rifiuto .. io faccio gli stessi procedimenti che sono presenti sul mio libro di testo.. lo svolgimento del punto c) come svolto da te non l'ho mai visto



"tommik":
sulla seguente statistica
$Z_(stat)=(bar(p)-p_(0))/sqrt((p_(0)(1-p_(0)))/n)~ N(0;1)$
questa statistica non è la statica di wald?! e dovrebbe essere in 2 varianti, al denominatore avente o la varianza esatta oppure la varianza stimata...giusto?
Sì, può anche essere vista così ma più semplicemente è l'applicazione del limite centrale
$(bar(x)-mu)/sigma sqrt(n)$
ad un test di prova delle ipotesi.
Infatti la distribuzione sorgente appartiene alla famiglia esponenziale, il test è unilaterale $rarr$ in virtù di un noto teorema

il test uniformemente più potente a livello $alpha$ è il seguente:
$alpha=P{SigmaX<=k|H_(0)}$
e di conseguenza arrivi alla standardizzazione proposta
$(bar(x)-mu)/sigma sqrt(n)$
ad un test di prova delle ipotesi.
Infatti la distribuzione sorgente appartiene alla famiglia esponenziale, il test è unilaterale $rarr$ in virtù di un noto teorema

il test uniformemente più potente a livello $alpha$ è il seguente:
$alpha=P{SigmaX<=k|H_(0)}$
e di conseguenza arrivi alla standardizzazione proposta
quindi la statistica di wald è anche detta test-z , in caso di un modello esponenziale, al denominatore che varianza uso?
cioè quale variante uso: $ w_0=(hatlambda_n-lambda_0)/(hatlambda/sqrt(n)) $ oppure $ w_0=(hatlambda_n-lambda_0)/(lambda_0/sqrt(n)) $ ?
considerando anche il fatto che lo stimatore $hatlambda$ è distorto...
cioè quale variante uso: $ w_0=(hatlambda_n-lambda_0)/(hatlambda/sqrt(n)) $ oppure $ w_0=(hatlambda_n-lambda_0)/(lambda_0/sqrt(n)) $ ?
considerando anche il fatto che lo stimatore $hatlambda$ è distorto...
famiglia esponenziale.....non modello... è un'altra cosa
una distribuzione appartiene alla famiglia esponenziale se la sua densità può essere scritta nella forma
$EXP{a(theta)+b(x)+c(theta)d(x)}$
quasi tutte le distribuzioni che conosci appartengono a tale famiglia....
Osservazione: se il dominio dipende dal parametro la distirbuzione non appartiene a questa famiglia
Per quanto riguarda la tua domanda è troppo generica...inserisci per bene l'esercizio che lo guardo...devo leggere bene il testo
Se il problema è un test di ipotesi unilaterale su una distribuzione esponenziale negativa molto probabilmente risolvi con una distribuzione Gamma e con le tavole della chi-quadro applicando il teorema che ti ho mostrato....oppure con una gamma inversa
Se il test è bilaterale occorre fare un po' più di attenzione.....
una distribuzione appartiene alla famiglia esponenziale se la sua densità può essere scritta nella forma
$EXP{a(theta)+b(x)+c(theta)d(x)}$
quasi tutte le distribuzioni che conosci appartengono a tale famiglia....
Osservazione: se il dominio dipende dal parametro la distirbuzione non appartiene a questa famiglia
Per quanto riguarda la tua domanda è troppo generica...inserisci per bene l'esercizio che lo guardo...devo leggere bene il testo
Se il problema è un test di ipotesi unilaterale su una distribuzione esponenziale negativa molto probabilmente risolvi con una distribuzione Gamma e con le tavole della chi-quadro applicando il teorema che ti ho mostrato....oppure con una gamma inversa
Se il test è bilaterale occorre fare un po' più di attenzione.....
no, praticamente volevo chiarirmi un pò le idee...confrontando 3 test statistici e il loro comportamento per quando riguarda un sistema di ipotesi. i 3 test sono, statistica di Wald (capire le 2 varianti in che casi utilizzarli), il TRV (test rapporto delle verosimiglianze) e il test score.
l'argomento è molto interessante ma piuttosto articolato...che testo usi?
In linea di principio, la prima cosa da fare è vedere se la distribuzione appartiene alla famglia esponenziale oppure no...in genere basta che il dominio non dipenda dal parametro affinché la distribuzione appartenga a tale famiglia (ad esempio la uniforme NON appartiene alla famiglia esponenziale...le alre distribuzioni quasi tutte sì)
una volta fatto questo occorre vedere se le ipotesi sono semplici oppure no.
in caso di ipotesi semplici il test più potente è quello del Lemma di Neyman Pearson
Nel caso di ipotesi composte ma test unilaterale usi il teorema che ti ho proposto
Nel caso di ipotesi composte e test bilaterale non c'è altra via che il rapporto fra le verosimiglianze generalizzato....ma i conti si possono complicare
Se invece il dominio dipende dal parametro occorre trovare un test che abbia il rapporto di verosimiglianza monotono....
Se invece i dati sono sufficientemente numerosi si può usare un test asintotico $-2logLambda~chi_(r)^2$
se usi il Mood Graybill Boes è tutto spiegato in maniera estremamente chiara e completa
In linea di principio, la prima cosa da fare è vedere se la distribuzione appartiene alla famglia esponenziale oppure no...in genere basta che il dominio non dipenda dal parametro affinché la distribuzione appartenga a tale famiglia (ad esempio la uniforme NON appartiene alla famiglia esponenziale...le alre distribuzioni quasi tutte sì)
una volta fatto questo occorre vedere se le ipotesi sono semplici oppure no.
in caso di ipotesi semplici il test più potente è quello del Lemma di Neyman Pearson
Nel caso di ipotesi composte ma test unilaterale usi il teorema che ti ho proposto
Nel caso di ipotesi composte e test bilaterale non c'è altra via che il rapporto fra le verosimiglianze generalizzato....ma i conti si possono complicare
Se invece il dominio dipende dal parametro occorre trovare un test che abbia il rapporto di verosimiglianza monotono....
Se invece i dati sono sufficientemente numerosi si può usare un test asintotico $-2logLambda~chi_(r)^2$
se usi il Mood Graybill Boes è tutto spiegato in maniera estremamente chiara e completa
solo appunti delle lezioni (appunti di un mio collega che ha già sostenuto l'esame), con gli impegni di lavoro non posso seguire le lezioni personalmente :/ ...