Alternative_hypothesis

Thomas16
Ciao, girando per il web mi sono scontrato con il concetto di "alternative hypothesis"....

Io ho sempre pensato che il concetto di "null hypothesis" fosse sufficiente per costruire un test statistico. La "null hypothesis" è assunta come vera e si controlla in qualche modo se i dati sono compatibili con questa. L' "alternative hypothesis" per me è quindi semplicemente la negazione della "null hypothesis". A quanto capisco però questo potrebbe non essere il caso... Come entra allora l' "ipotesi alternativa" nalla costruzione di un test statistico? Non riesco ora come ora a trovare la risposta...

Grazie mille,

Thomas

Risposte
Lo_zio_Tom
"Thomas":
Come entra allora l' "ipotesi alternativa" nalla costruzione di un test statistico?


ciao Thomas...

la costruzione di un test statistico UMP (Uniformly Most Powerful) avviene mettendo in relazione l'ipotesi nulla rispetto all'alternativa, ovvero si va a costruire una regione critica (regione di rifiuto di $H_(0)$, cioè una regione con "abbastanza" evidenze empiriche contro l'ipotesi nulla) che, fissato un errore di prima specie $alpha$, abbia la potenza maggiore. Tale funzione di potenza (probabilità di rifiutare l'ipotesi nulla quando è falsa) è funzione dell'ipotesi alternativa $H_(1)$.


Facciamo un esempio: Supponiamo di avere una distribuzione normale $X~ N(theta;1)$ di media ignota e varianza 1. Estraiamo un campione casuale di ampiezza 4: $X_(1),...,X_(4)$ e, sulla base delle risultanze campionarie, vogliamo provare l'ipotesi che $theta=0$ fissando un errore del primo tipo pari a $alpha=0,05$.
E' evidente che le risultanze che possono confutare tale ipotesi saranno di diverso peso a seconda che l'ipotesi alternativa sia

$theta_(1): theta>0$ oppure $theta_(1): theta!=0$

vediamo quindi i due casi separatamente:

Dalla teoria sappiamo che l'UMP test in caso di ipotesi composte (come questo caso) si trova utilizzando test del rapporto di verosimiglianza generalizzato

$lambda(ul(x))=(Sup_(theta in Theta_(0))L(ul(x),theta))/(Sup_(theta in Theta_(0) uu Theta_(1))L(ul(x),theta))$

Caso A)

${{: ( H_(0): theta=0 ),( H_(1): theta>0 ) :}$

a conti fatti otteniamo la seguente regione di rifiuto:

Rifiutiamo $H_(0)$ a livello 5% se e solo se $bar(x)>0,83$

Caso B)

${{: ( H_(0): theta=0 ),( H_(1): theta!=0 ) :}$

a conti fatti otteniamo la seguente regione di rifiuto:

Rifiutiamo $H_(0)$ a livello 5% se e solo se $|bar(x)|>0,98$

come puoi notare, a parità di ipotesi nulla, la regione di rifiuto cambia avendo modificato l'ipotesi alternativa.

vediamo i conti del caso B) che sono i più articolati.


Thomas16
Grazie mille Tommik! Cerco di rifarmi i tuoi conti per vedere se ho capito bene...

In ogni caso quindi a quanto capisco per ora l'ipotesi alternativa serve per definire il "power" di un test e quindi scegliere i valori che definiscono le regioni di accettazione e rifiuto?

Thomas16
Sto provando a seguire i tuoi conti, anche guardando questo sito:

http://local.disia.unifi.it/VL/VL_IT/hy ... esis6.html

e quindi per costruire questo:

$lambda(ul(x))=(Sup_(theta in Theta_(0))L(ul(x),theta))/(Sup_(theta in Theta_(0) uu Theta_(1))L(ul(x),theta))$

pensavo di costruire numeratore e denominatore separatamente. Per il denominatore:

$Sup_(theta in Theta_(0) uu Theta_(1))L(ul(x),theta)$

mi pare di capire che suggerisci che il sup sia per $theta=(x_1+x_2+x_3+x_4)/4$ in quando questo è lo stimatore di massima likelihood (ma likelyhood si traduce con verosimiglianza in italiano? giusto per essere sicuro che non si intendano cose diverse..). E' corretto?

Per il numeratore:

$Sup_(theta in Theta_(0))L(ul(x),theta)$

avrei detto che essendo $\Theta_(0)$ solo il parametro com media nulla, il massimo fosse il valore di $L(x,theta)$ per $theta=0$, ovvero:

$e^{-x_1^2}e^{-x_2^2}e^{-x_3^3}e^{-x_4^4}$

con le opportune costanti di normalizzazione.

Non vedo però corrispondenza con i tuoi conti. Cosa sbaglio? Forse male interpreto delle definizioni?

Grazie mille per la pazienza :wink:

Lo_zio_Tom
Per il casoA) basta ricordare che l'UMP test è bastato sullo stimatore sufficiente per $ theta $ quindi la regione critica è

$ sumx>=k $ ovvero $ bar (x)>=k $

i conti che hai fatto sono giusti...ho solo saltato qualche passaggio. ..stasera se non riesci te li posto tutti ma è davvero molto semplice

Thomas16
ehm si come vedi sto avendo dei problemi a seguirti... :(

Thomas16
Ottimo :). Allora provo a partire da quel che ho scritto e terminarli :)

Thomas

Lo_zio_Tom
Il rapporto fra le massime verosimiglianze viene

$((1/sqrt(2pi))^n e^(-1/2sum_(i)x_(i)^2))/((1/sqrt(2pi))^n e^(-1/2sum_(i)(x_(i)-bar(x))^2))<=k$

$-1/2sum_(i)x_(i)^2+1/2sum_(i)(x_(i)-bar(x))^2<=logk$

$sum_(i)(x_(i)-bar(x)^2)-sum_(i)x_(i)^2<=logk^2$

$sum_(i)x_(i)^2+nbar(x)^2-2nbar(x)^2-sum_(i)x_(i)^2<=logk^2$

$bar(x)^2> -(log(k^2))/n$

quindi in definitiva la regione critica è

$|bar(x)|>k^*$

ora, fissando un errore di prima specie pari al 5% otteniamo

$0,05=P(|bar(x)|>k^*|H_(0))$

utilizziamo quindi la standardizzazione $z=(bar(x)-mu)/sigma sqrt(n)$ ottenendo

$0,95=P(|bar(x)|sqrt(4)
e quindi

$|bar(x)|=z_(0,975)/2=(1,96)/2=0,98$

Per quanto riguarda il punto A) invece, basta ricordare il seguente



e quindi la regione critica è ${C: bar(x)>k}$ e di conseguenza

$0,05=P(bar(x)>k|H_(0)) rarr bar(x)=(z_(0,95))/sqrt(n)=(1.645)/2=0.83$

[ot]manco a farlo apposta un utente ha postato QUESTO esercizio che ho risolto e che ti potrebbe essere utile per chiarire meglio l'argomento di questo topic[/ot]

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.