Ampiezza e potenza del test

Lo_zio_Tom
Il seguente esercizio è per spiegare il concetto di funzione di potenza ad un utente che mi ha posto un quesito in PM

Sia $X$ una singola osservazione dalla densità

$f(x;theta)=thetax^(theta-1)I_((0;1))(x)$, $" "theta>0$

Nel verificare il seguente sistema di ipotesi

${{: ( mathcal(H)_0 : theta<=1),( mathcal(H)_1:theta>1 ) :}$

determinate la funzione di potenza e l'ampiezza (l'errore di primo tipo) di un test con la seguente regione di rifiuto: si rifiuti $mathcal(H)_0$ se e solo se $X>=1/2$


Soluzione:

Per calcolare la funzione di potenza $pi(theta)$ è sufficiente usare la definizione della regione di rifiuto ma mettere $theta$ al posto di $theta=1$

Quindi

$pi(theta)=P{X>=1/2|theta}=int_(1/2)^(1)thetax^(theta-1)dx=1-1/2^theta$

mentre l'errore di primo tipo coincide con la funzione di potenza quando $theta rarr 1$ ovvero $alpha=1/2$. Si nota facilmente che, più $theta$ si discosta da $theta_0=1$ più la potenza aumenta....

Ovviamente l'errore di primo tipo lo puoi calcolare con la medesima formula

$alpha=P{X>=1/2|theta=1}=int_(1/2)^(1)dx=1-1/2=1/2$

Risposte
markowitz
Mi sembra ci sia qualcosa che non va.

"tommik":
...Si nota facilmente che, più $ theta $ si discosta da $ theta_0=1 $ più la potenza aumenta....



Direi di no. Per $0 Invece è vero, se ricordo bene, che $pi(theta)$ dovrebbe mostrare un minimo nel punto $theta=theta_0$

Potrebbe essere che il problema sia in un ipotesi nulla non puntuale ?

Forse ponendo le ipotesi così: $H_0: theta=1$ vs $H_1: theta>1$ le cose tornano. Chiaramente il dominio di $theta$ dovrebbe allora essere rstretto a: $theta>=1$

Lo_zio_Tom
"markowitz":

Per $0

[-X

Per $0
L'errore di prima specie è così definito:

$alpha=Sup_(theta <=1)pi(theta)=1/2$

Mentre ovviamente la Potenza, come ben ricordi, ha il suo minimo in $ lim_(thetararr1^+)pi(theta)=alpha$

Che l'ipotesi di lavoro sia $theta=1$ oppure $theta <=1$ è del tutto indifferente

Come si vede, aumentando $theta$ la Potenza aumenta...

markowitz
Si hai ragione, ho fatto un po di confusione con valori del parametro e relative ipotesi.

Fammi provare a riscrivere in modo leggermente diverso quello che hai scritto tu e dimmi che ne pensi.
La funzione potenza la possiamo scrivere così:
$ pi(theta)=P{X>=1/2|theta>1}=int_(1/2)^(1)thetax^(theta-1)dx=1-1/2^theta $
che è quello che intendevi tu

mentre l'errore di primo tipo:
$ alpha=P{X>=1/2|theta<=1}=int_(1/2)^(1)dx=1-1/2=1/2 $
che però mi lascia un po perplesso.
In particolare quando dici

"tommik":

... l'ipotesi [nulla] di lavoro sia $ theta=1 $ oppure $ theta <=1 $ è del tutto indifferente

possibile ? Peraltro, in sostanza, è attorno a questo punto che ieri mi sono incartato.

Non dovrebbe valere per l'errore di primo tipo:
$ alpha=P{X>=1/2|theta<=1}=int_(1/2)^(1)thetax^(theta-1)dx=1-1/2^theta $
che poi anche intuitivamente ci sta a dire che per $theta rarr 0$ è prorpio difficile che commettiamo un errore di prima specie
mentre se $theta rarr 1/2$ diventa via via più probabile (con limite superiore al $50%$?
Dici che da definizione dobbiamo considerare solo quest'ultimo caso limite?

Non so ... sarà ma mi sembra favorire la confusione perché, più in generale, com'è possibile che l'errore di prima specie (e quindi anche il p-valore) siano indipendenti da come scrivo la nulla?

Walter97lor
Ciao markowitz, provo a dare una risposta al quesito.
Tommik ha scritto correttamente l'errore di 1 tipo in quanto si tratta, come saprai, di rifiutare $H_0$ quando essa è vera, si sostituiscono i valori che si hanno e si procede al calcolo.
In riferimento al tuo quesito riguardo al calcolo di $alpha$; nei test d'ipotesi si va a studiare la situazione al limite $theta=theta_0$, nell'eventualità che si rifiuti $theta=theta_0$ a favore, ad es. di $theta>theta_0$, l'evidenza che si ha a sfavore di $theta

Lo_zio_Tom
Esattamente come ha scritto Walter:

Nel sistema ad ipotesi composte unilaterale
${{: ( mathcal(H_0):mu<=mu_0 ),( mathcal(H_1):mu>mu_0 ) :}$


le due ipotesi non sono paritetiche; $mathcal(H)_0$ gioca un ruolo privilegiato rispetto all'altra ed è considerata vera fino a prova contraria. In questo caso la funzione $pi(theta)$ rappresenta il p-value ed è funzione crescente di $theta$

$pi(theta)=1-1/2^theta$


Quindi più il p-value è piccolo e più è facile rifiutare l'ipotesi nulla...quindi prenderemo come valore soglia di rifiuto il valore più favorevole a $mathcal(H)_0$ ovvero quello per cui $mathcal(H)_0=mu_0$

In termini formali abbiamo che

$alpha=Sup_(theta in Theta_0) pi(theta)$


Di conseguenza i due sistemi di ipotesi

${{: ( mathcal(H_0):mu<=mu_0 ),( mathcal(H_1):mu>mu_0 ) :} harr{{: ( mathcal(H_0):mu=mu_0 ),( mathcal(H_1):mu>mu_0 ) :}$


risultano equivalenti

markowitz
"Walter97lor":
Ciao markowitz, provo a dare una risposta al quesito.
Spero di aver chiarito qualcosa e non di averti detto solamente cose che già sai.

Sono cose che conosco, il quadro generale mi è chiaro. Ma non è un problema, la discussione è qui per tutti.

Per quanto riguarda aver chiarito qualcosa ... vediamo.
Provo a risponderti:
"Walter97lor":

Tommik ha scritto correttamente l'errore di 1 tipo in quanto si tratta, come saprai, di rifiutare $ H_0 $ quando essa è vera,

Certo. Più esplicitamente si tratta di calcolare la probabilità di rifiutare la nulla quando la nulla è vera.
Il punto che sollevo però è che, in generale, tale probabilità non può essere indipendente da come scrivo la nulla. In altre parole, tale probabilità non può essere indipendente dall'evento/circostanza/spazio/ipotesi rispetto a cui condiziono.

tommik ha affermato che in questo caso particolare due modi diversi di scrivere la nulla ($theta=1$ è $theta<=1$) non producono differenze ... probabilmente ha ragione lui. Se capisco bene nella definizione che ha mostrato

"tommik":


L'errore di prima specie è così definito:

$ alpha=Sup_(theta <=1)pi(theta)=1/2 $


è l'operatore $Sup$ a dargli ragione.
Tuttavia continuo a restare un po perplesso ... come minimo il rischio di confusione è grande.

Ad esempio torno a quanto hai scritto:
"Walter97lor":

In riferimento al tuo quesito riguardo al calcolo di $ alpha $; nei test d'ipotesi si va a studiare la situazione al limite $ theta=theta_0 $, nell'eventualità che si rifiuti $ theta=theta_0 $ a favore, ad es. di $ theta>theta_0 $, l'evidenza che si ha a sfavore di $ thetaa maggior ragione più forte.

Detta così, e senza altro leggere, sembra che si tratti di un ipotesi puntuale contro un alternativa unilaterale.
Infatti è proprio su quel "a maggior ragione" che resto perplesso ... infatti è proprio qui che entra quel $Sup$.
Sarà che sono abituato a ragionare di test su ipotesi puntuale contro alternativa bilaterale ... proverò a rifare l'esercizio ponendo $H_0: theta=theta_0$ vs $H_1: theta!=theta_0$

markowitz
tommik, vedo solo ora il tuo ultimo messaggio ...

markowitz
"tommik":
In questo caso la funzione $ pi(theta) $ rappresenta il p-value ed è funzione crescente di $ theta $

$ pi(theta)=1-1/2^theta $

Quindi più il p-value è piccolo e più è facile rifiutare l'ipotesi nulla...quindi prenderemo come valore soglia di rifiuto il valore più favorevole a $ mathcal(H)_0 $ ovvero quello per cui $ mathcal(H)_0=mu_0 $



Si mi torna, basta ragionare sullo spazio $0
Buon viaggio!

markowitz
Lasciatemi aggiungere qualcosa.

In base al messaggio sopra sembra che il p-valore dipenda dal valore di $theta$ e non dipenda da quello di $x$. In realtà è vero il contrario.

In particolare

"tommik":

$ pi(theta)=P{X>=1/2|theta}=int_(1/2)^(1)thetax^(theta-1)dx=1-1/2^theta $


e stiamo sottintendendo che $x=1/2$ sia la statistica test effettivamente osservata ... e che $theta in Theta_0$ ... questo rende un po meglio l'idea del p-valore ... allora però dobbiamo prendere il $Sup_(theta in Theta_0) pi(theta) $ e torniamo a

"tommik":

$ alpha=P{X>=1/2|theta=1}=int_(1/2)^(1)dx=1-1/2=1/2 $

dove $alpha$ è il livello di significatività osservato ... ovvero il p-valore, che non dipende da $theta$ ma da $Theta_0$ e da $x$.

Più in generale:
$ alpha_(obs)=P{X>=x|theta=1}=int_(x)^(1)dx=1-x $
che ci sta a dire come la statistica test abbia distribuzione $U(0,1)$, sotto la nulla, e che basta prendere il complemento del valore osservato di detta statistica per avere anche la significatività osservata ad essa relativa. :-)

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.