Applicazione teorema di pearson

Luca342
Salve, cerco aiuto per un problema di statistica riguardo l applicazione del lemma di pearson. In particolare mi si chiede:
"Dato un campione distribuito in modo esponenziale (sia lambda il fattore di normalizzazione), testare con il most powerful test H0(lambda=lambda0) e H1(lambda=lambda1).
Volevo capire soprattutto come procedere dopo aver calcolato il rapporto f1/f0 e averlo posto $>=$ c

Mi scuso per qualsiasi errore abbia fatto nel proporvi il mio problema, nell usare la simbologia o simili. Ahimè non sono mai stato in un forum e per me è tutto abbastanza ignoto, nonostante abbia letto il regolamento . Vi prego di sgridarmi per bene nel caso abbia sbagliato qualcosa.
Grazie per l aiuto!

Risposte
Lo_zio_Tom
manca ancora qualche dato ma lo completiamo subito. Intanto il lemma di pearson può essere posto maggiore o minore, dipende come lo definisci. Inoltre devi specificare l'ampiezza del campione (n potrebbe anche essere uno) e se il parametro dell'ipotesi alternativa è maggiore o minore di quello dell'ipotesi di lavoro)

Quindi,

sia ${X_(1),...,X_(n)}$ un campione casuale estratto da $f(x)=theta e^(-thetax)$

vogliamo provare l'ipotesi

${{: ( H_(0):theta=theta_(0) ),( H_(1):theta=theta_(1)>theta_(0) ) :}$

a livello di confidenza $alpha$. Dato che le ipotesi sono entrambe semplici il test più potente è quello di Neyman Pearson

$(L(ul(x),theta_(0)))/(L(ul(x),theta_(1)))<=k$

$(theta_(0)^n e^(-theta_(0)Sigmax))/(theta_(1)^n e^(-theta_(1)Sigmax))<=k$

da risolvendo rispetto alla statistica campionaria ottieni subito che la regione di rifiuto è

$Sigmax<=k^*$

Quindi il UMP test a livello $alpha$ è

$alpha=P{Sigmax<=k^*|theta_(0)}$

per risolverlo occorre sapere la distribuzione di $Sigmax$...e lo sappiamo, perché la somma di esponenziali indipendenti si distribuisce come una gamma.

Ma possiamo fare anche di più...possiamo standardizzare la gamma ed usare le tavole con la statistica

$Y=2thetaSigmax~chi_((2n))^2$

fine del problema

PS: se avessi letto il regolamento avresti anche capito che devi mettere una bozza di soluzione e non solo il testo del problema..tra l'altro mal scritto

Buona giornata

Luca342
Ti ringrazio, per l'aiuto e il consiglio; la prossima volta presterò attenzione affinché la mia domanda sia più esaustiva e rispetti i criteri che mi hai suggerito.

Tornando al problema: il testo è praticamente quello che ti riporto, dettatomi in classe dal docente (quindi potrai immaginare da dove derivano i miei problemi).

C'è una cosa che non mi è chiara. L'ipotesi alternativa è stata posta

$\theta = \theta_1 > \theta_0$

Ora, perché posso sicuramente imporre questa condizione? Nel cercare di risolvere quel problema incappavo in una espressione per la regione di rifiuto abbastanza lontana da quanto mi aspettassi, quindi non capivo come procedere.

Lo_zio_Tom
$theta_(1)>theta_(0)$ non lo puoi "imporre"

Dovendo confrontare fra loro due ipotesi semplici, necessariamente una sarà maggiore o minore dell'altra.
A seconda di ciò, risolvendo il Lemma troverai una diversa regione di rifiuto.

La condizione l'ho imposta io per poterlo risolvere...se fosse $theta_(1) Prova a fare i conti anche nel caso opposto.


facciamo così:

$n=10$

$alpha=0.05$

$theta_(0)=1$

$theta_(1)=2$

definire la regola di decisione e calcolare la potenza del test....così fai un po' di conti....

Luca342
Allora. Provando con i numeri che mi hai dato arrivo a dire:
$\bar x <= 1/10 \log(c) - \log(2)$

Come, nel caso dei $/theta$ arrivavo a dire

$\bar x >= \frac { \log(\theta_0) - \log(\theta_1) + 1/N\log(c)}{\theta_0 - \theta_1} $

Dove $\bar x$ lo ottengo ponendo$\sum_{i=1}^n \x_i = N* \bar x $

Ora tu penserai che sia stupido poichè mi sono allontanato dalla strada che mi hai suggerito. Il problema è che in classe, il docente ha "svolto" un esercizio in modo analogo. Lui vuole $/bar x$ ? Io sono passato da questa senza pensarci. Ora i miei problemi si presentano subito dopo, quando devo applicare la formulina per l' errore di prima specie (perdonami se non uso i simboli).

Ora le cose sono due: o io non trovo un immediato collegamento tra la tua modalità di risoluzione e quella del prof, o in effetti quella che ti ho proposto è una inutile complicazione

Lo_zio_Tom
io ho trovato come statistica $Sigmax$

ovviamente anche $bar(x)$ può andare....ma complichi le cose inutilmente perché poi devi sapere che distribuzione ha $bar(X)$


....che è sempre una Gamma con diversi parametri....e quindi standardizzi e ritrovi di nuovo la chi-quadro..

ti ho fatto vedere come risolverlo....certo non posso entrare anche nella mente del prof.....

tornando al nostro esempio, dopo semplici calcoli ottieni


$0.05=P{Sigmax
e quindi basta guardare le tavole di una chi quadro con 20 gdl

Luca342
Certamente! E ti ringrazio. Comunque mi hai chiarito parecchie cose. Cercherò di portarlo avanti utilizzando entrambe le statistiche. Grazie infinite per il tempo che mi hai dedicato!

Lo_zio_Tom
nota anche quanto segue:

Utlilizzando il teorema di fattorizzazione, il rapporto di Neyman Pearson può essere riscritto così:


$(h(ul(x))g[t(ul(x)),theta_(0)])/(h(ul(x))g[t(ul(x)),theta_(1)])<=k$

dove $t(ul(x))$ è lo stimatore sufficiente.

Quindi la regione di rifiuto è sicuramente funzione dello stimatore sufficiente.

Io ho usato lo stimatore sufficiente e minimale ($Sigmax$) mentre il tuo prof ha usato un altro stimatore sufficiente ($bar(X)$) ma non minimale

a questo punto l'unica difficoltà è quella di capire il verso della disuguaglianza, che dipende dalla condizione $theta_(1)<>theta_(0)$...dopodiché basta leggere il valore sulle tavole della chi-quadro

....fra le due soluzioni (entrambe corrette) la mia è sicuramente la più snella

cordiali saluti

Luca342
Non mi ero accorto della risposta. Comunque, avresti qualche consiglio per portare avanti l'esercizio utilizzando la statistica media campionaria?

Lo_zio_Tom
E' LA STESSA IDENTICA COSA!! La n di differenza fra la mia soluzione e quella del tuo prof si semplifica quando standardizzi....

$X~Exp(theta)$

$SigmaX~Gamma(n,theta)$

$(SigmaX)/n=bar(x)~Gamma(n,ntheta)$

$2nthetabar(x)=2thetaSigmaX=Y~chi_((2n))^2$

a questo punto usi le tavole

per fare un esempio numerico (quello che ti ho messo prima) ottieni

$0.05=P{bar(X)<=k|theta=1}=P{20bar(x)<=k}rarr 20bar(x)=10.85$

quindi rifiuto l'ipotesi che $theta=1$ contro l'alternativa che $theta=2$ se $bar(x)<0.5425$

che mi sembra anche una soluzione logica, visto che il parametro dell'esponenziale è il reciproco della media.....


ciao

Luca342
Il punto è questo. Non riesco a procedere nella standardizzazione. Spero di non risultare fastidioso, ma mi servirebbe un procedimento esplicito. Il lemma mi è stato spiegato qualche giorno fa e mi servirebbe un esempio chiaro di procedimento

Lo_zio_Tom
il problema della standardizzazione non ha nulla a che vedere con la prova delle ipotesi...forse non hai studiato gli argomenti precedenti

Per capire le standardizzazioni occorre identificare prima i modelli statistici. Esistono

1) modelli di posizione

2) modelli di scala

3) modelli di scala e posizione

ognuno di questi si standardizza in maniera differente


esempio:


$f(x)=1/thetaI_([0;theta])(x)$

come si standardizza questa distribuzione?

Se conoscessi i modelli sapresti che questo (uniforme) è un modello di scala che si standardizza così:

$Y=X/theta$

infatti


$f_(Y)(y)=f_(X)(g^(-1)(y))|d/(dy)g^(-1)|=1$

che non dipende più dal parametro.

Luca342
Chiarissimo!! Ora ho capito! Trovavo difficoltà perché non riuscivo a passare alla chi quadro. Ti ringrazio e perdonami se ti ho creato disturbo !

Lo_zio_Tom
ottimo....in ogni caso ecco la tua standardizzazione


$f(x)=theta^n/(Gamma(n) )x^(n-1)e^(-xtheta)$

$Y=2thetaX$


$f(y)=theta^n/(Gamma(n) )y^(n-1)/(2theta)^(n-1)e^(-(ytheta)/(2theta)) 1/(2theta)=(1/2)^n/(Gamma(n))y^(n-1)e^(-y/2)~Gamma(n;1/2)=Gamma((2n)/2;1/2)=chi_((2n))^2$

che ovviamente non dipende più dal parametro e quindi ti consente l'utilizzo delle tavole

Lo_zio_Tom
giusto per spezzare la serata in attesa della partita di calcio...ti propongo questo:



se non ti piace il sistema di ipotesi composte puoi tranquillamente risolverlo con le ipotesi semplici....

è un po' più articolato di quello che hai postato tu, soprattutto per i logaritmi che troverari (che saranno tutti negativi) e che ti incasineranno un pochino il verso della regione critica ma nulla di proibitivo.....devi riuscire anche qui ad usare le tavole della chi-quadro

(se ti interessa imparare, ovviamente, dato che qui non siamo a scuola)


buon lavoro

Luca342
Certo che lo proverò, presto avrai buone notizie (spero) :D

PS. Rimuginavo sull esercizio e mi chiedevo: aggiungendo come ipotesi che il mio campione $x_1,....,x_n$
sia arbitrariamente grande, sotto questa condizione è possibile risolverlo anche riconducendo $bar x$ ad una gaussiana per mezzo del teorema del limite centrale?

Lo_zio_Tom
come ti ho dimostrato in uno dei miei post precedenti, se la distribuzione ammette stimatore sufficiente, il test più potente è sicuramente basato su tale stimatore $t(ul(x))$

Ora, sei in grado di trovare lo stimatore sufficiente di $theta$ per la distribuzione in oggetto?

Per trovare uno stimatore sufficiente si possono seguire diverse strade

1) la definizione di sufficienza

2) il teorema di fattorizzazione

3) l'appartenenza della distribuzione alla famiglia esponenziale


il metodo 3) è il più immediato, ammesso che la distribuzione appartenga a tale famiglia.....





una volta trovato lo stimatore sufficiente e la sua distribuzione vedrai che il problema sarà molto simile all'esercizio che hai postato tu perché ti ho fatto appositamente un esempio da ricondurre al tuo esercizio precedente.


Per la distribuzione gaussiana ci sono diversi problemi:

1) sarebbe comunque una soluzione asintotica e per le soluzioni asintotiche esiste un apposito test che farai sicuramente: $-2logLambda$

2) dovresti anche sapere cosa significa $theta$ per quella distribuzione.....

Luca342
Chiaro. Comunque considera che il corso che seguo è da 6 crediti, di cui solo 3 (circa 27 ore) sono dedicate al'inferenza statistica. Di queste devi ignorare una decina che si articolano in esercitazione frontale. Ovviamente questa non è una scusa per la mia dilagante ignoranza in materia, ma non credo che gli argomenti che mi verranno """spiegati""' siano sufficienti ad affrontare la maggior parte dei temi che invece servirebbero. In sunto: ho imparato più qui in 2 giorni che in 5-6 lezioni (e ti ringrazio per questo).

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.