Problema urgente sulla verifica di ipotesi statistiche
Vi prego di aiutarmi con questo problema, di seguito vi riporto il testo:
Lungo un'autostrada settimanalmente il numero di incidenti, Xi, segue una distribuzione di Poisson con valore atteso lambda0=5 (si tratta del valore medio in una settimana). Si vuole esaminare se un aumento dei limiti di velocità massima da 130 a 140 Km/h avrà un effetto su lambda0. Per 10 settimane è stato osservato che Xi ha assunto i seguenti valori: 5, 2, 9, 6, 3, 7, 9, 1, 6, 8. Verificare con alfa=0.05 (livello di significatività del test) l'optesi di base lamda=lambda0 contro l'ipotesi alternativa lambda>lambda0. La soluzione dovrebbe essere che è verificata l'ipotesi di base.
Ho provato di tutto..dalla stima Massima verosimiglianza all'uso dell'ipotesi nulla incompleta con la statistica di Pearson modificata..non riesco a venirne a capo...per favore chi può mi aiuti grazie!
Lungo un'autostrada settimanalmente il numero di incidenti, Xi, segue una distribuzione di Poisson con valore atteso lambda0=5 (si tratta del valore medio in una settimana). Si vuole esaminare se un aumento dei limiti di velocità massima da 130 a 140 Km/h avrà un effetto su lambda0. Per 10 settimane è stato osservato che Xi ha assunto i seguenti valori: 5, 2, 9, 6, 3, 7, 9, 1, 6, 8. Verificare con alfa=0.05 (livello di significatività del test) l'optesi di base lamda=lambda0 contro l'ipotesi alternativa lambda>lambda0. La soluzione dovrebbe essere che è verificata l'ipotesi di base.
Ho provato di tutto..dalla stima Massima verosimiglianza all'uso dell'ipotesi nulla incompleta con la statistica di Pearson modificata..non riesco a venirne a capo...per favore chi può mi aiuti grazie!
Risposte
Propongo un ragionamento, al momento non mi viene in mente nulla di meglio.
Nell'ipotesi $H_0$, le $n=10$ osservazioni provengono da una Poisson di parametro $lambda=5$.
La v.a. di Poisson è riproducibile, nel senso che la somma di $n$ v.a. di Poisson indipendenti è distribuita come una Poisson con parametro pari alla somma dei parametri. Quindi $Y=sum_(i=1)^(n)X_i\sim"Poisson"(50)$ (il parametro è $lambda=50=5*10$).
L'osservazione sperimentale è $Y_(oss)=5+2+...+6+8=56$
La $P(Y>=56)$ è quindi la probabilità di osservare il risultato sperimentale o valori più estremi (corrispondenti all'ipotesi alternativa $H_1:{lambda>5}$), quindi dovrebbe essere il p-value.
Mi risulta $P(Y>=56)=1-P(Y<=55)=0.2155$ (calcolato col software statistico R). Non posso rifiutare $H_0$ al livello $alpha=0.05$.
Una buona stima di $P(Y>=56)$ può essere ottenuta approssimando la Poisson con una Normale di media e varianza $lambda=50$ (essendo $lambda>10)$, tenendo conto della correzione di continuità:
$P(Y>=56)=P(Z>=(55.5-50)/sqrt(50))=1-P(Z<=0.7778)=0.2183$
Nell'ipotesi $H_0$, le $n=10$ osservazioni provengono da una Poisson di parametro $lambda=5$.
La v.a. di Poisson è riproducibile, nel senso che la somma di $n$ v.a. di Poisson indipendenti è distribuita come una Poisson con parametro pari alla somma dei parametri. Quindi $Y=sum_(i=1)^(n)X_i\sim"Poisson"(50)$ (il parametro è $lambda=50=5*10$).
L'osservazione sperimentale è $Y_(oss)=5+2+...+6+8=56$
La $P(Y>=56)$ è quindi la probabilità di osservare il risultato sperimentale o valori più estremi (corrispondenti all'ipotesi alternativa $H_1:{lambda>5}$), quindi dovrebbe essere il p-value.
Mi risulta $P(Y>=56)=1-P(Y<=55)=0.2155$ (calcolato col software statistico R). Non posso rifiutare $H_0$ al livello $alpha=0.05$.
Una buona stima di $P(Y>=56)$ può essere ottenuta approssimando la Poisson con una Normale di media e varianza $lambda=50$ (essendo $lambda>10)$, tenendo conto della correzione di continuità:
$P(Y>=56)=P(Z>=(55.5-50)/sqrt(50))=1-P(Z<=0.7778)=0.2183$
ti ringrazio per la risposta...credo che il ragionamento vada bene..anche se rimane secondo me il dubbio sull'impiego delle due velocità 130 e 140 Km/h ma forse quello era un dato messo apposta per depistare....quindi, l'importante ai fini dell'accettazione dell'ipotesi di base, è il fatto che il valore uscente sia maggiore del livello di significatività alfa vero?
io invece avevo fatto: Q=(Xmedio-eta0)/(sigma*radice di n) dove Xmedio=5.6 eta0=5 e sigma oppure S=deviazione standard (che qui è incognita)=radice di 5, mentre radice di n=radice di 10 (numero di settimane in cui si valuta il numero di incidenti)...mi usciva fuori un valore=0.084 che comunque era compreso tra i valori della normale standard e cioè Zalfa/2=-1.95 e Z1-alfa/2=1.95...(ho usato le tabelle in fondo al mio libro).
Mentre un altro procedimento poteva essere usando la statistica di pearson modificata ovvero facendo la sommatoria con i che va i=1 a m di (ki-npi)^2/npi con pi=distribuzione di poisson dei singoli incidenti per ogni settimana ed n=56 ovvero il numero di incidenti totali nelle 10 settimane, m=10, le 10 settimane appunto; il valore uscente dalla sommatoria è 20.38 circa..e questo però verrebbe maggiore della chiquadro relativa al valore alfa associato (CHIQUADOR1-alfa=16.92) andando a finire nella regione critica...
Se per favore qualcuno può confermarmi o meno i due ragionamenti alternativi proposti da me..
io invece avevo fatto: Q=(Xmedio-eta0)/(sigma*radice di n) dove Xmedio=5.6 eta0=5 e sigma oppure S=deviazione standard (che qui è incognita)=radice di 5, mentre radice di n=radice di 10 (numero di settimane in cui si valuta il numero di incidenti)...mi usciva fuori un valore=0.084 che comunque era compreso tra i valori della normale standard e cioè Zalfa/2=-1.95 e Z1-alfa/2=1.95...(ho usato le tabelle in fondo al mio libro).
Mentre un altro procedimento poteva essere usando la statistica di pearson modificata ovvero facendo la sommatoria con i che va i=1 a m di (ki-npi)^2/npi con pi=distribuzione di poisson dei singoli incidenti per ogni settimana ed n=56 ovvero il numero di incidenti totali nelle 10 settimane, m=10, le 10 settimane appunto; il valore uscente dalla sommatoria è 20.38 circa..e questo però verrebbe maggiore della chiquadro relativa al valore alfa associato (CHIQUADOR1-alfa=16.92) andando a finire nella regione critica...
Se per favore qualcuno può confermarmi o meno i due ragionamenti alternativi proposti da me..