Statistica sufficiente e completa di un campione aleatorio
Buongiorno a tutti.
Dato un campione aleatorio $Y$ di dimensione N, la cui componente n-esima ha la seguente pdf:
Determinare se il campione è di classe esponenziale regolare.
Individuare una statistica sufficente, la meno informativa possibile, e valutarne la pdf.
Il primo punto se verificato permette di individuare la statistica sufficiente completa che è anche la meno informativa tra le statistiche sufficienti. Ma affinchè sia verificata la condizione il supporto della variabile o del campione in questo caso non deve dipendere dal parametro incognito. In questo caso $u[y-x]$ sottolinea questa dipendenza. Sperando di aver fatto bene questo ho provato ad individuare con il Teorema di fattorizzazione la statistica sufficiente. A questo punto ho bisogno di voi. Grazie!
Dato un campione aleatorio $Y$ di dimensione N, la cui componente n-esima ha la seguente pdf:
$f_Y(y|x) = exp[-(y-x)] * u[y-x]$
Determinare se il campione è di classe esponenziale regolare.
Individuare una statistica sufficente, la meno informativa possibile, e valutarne la pdf.
Il primo punto se verificato permette di individuare la statistica sufficiente completa che è anche la meno informativa tra le statistiche sufficienti. Ma affinchè sia verificata la condizione il supporto della variabile o del campione in questo caso non deve dipendere dal parametro incognito. In questo caso $u[y-x]$ sottolinea questa dipendenza. Sperando di aver fatto bene questo ho provato ad individuare con il Teorema di fattorizzazione la statistica sufficiente. A questo punto ho bisogno di voi. Grazie!
Risposte
Quesito abbastanza interessante:
intanto la x non mi piace affatto, è un parametro reale, preferisco chiamarlo $theta$
La tua funzione di densità viene dunque così
$f_Y(y|theta)=e^(theta)e^(-y) mathbb{1}_([theta;+oo))(y)$
Per trovare la statistica sufficiente, con il teorema di fattorizzazione subito abbiamo
$e^(-Sigma y)e^(n theta) mathbb{1}_((-oo;min (y)])(theta)$
quindi si vede subito che $T= min (y)$ è lo stimatore sufficiente.
Ora il calcolo della sua pdf dovrebbe esserti agevole (e comunque è necessaria per il punto successivo)
Completezza: qui è tutto un altro discorso; dato che il modello non è regolare, non abbiamo la certezza che lo stimatore sufficiente sia anche completo. Occorre provare o meno la completezza con la definizione. Ci sono calcoli da fare e studio sottostante. Fammi vedere i tuoi progressi e, se avrò tempo e soprattutto voglia, interverrò
intanto la x non mi piace affatto, è un parametro reale, preferisco chiamarlo $theta$
La tua funzione di densità viene dunque così
$f_Y(y|theta)=e^(theta)e^(-y) mathbb{1}_([theta;+oo))(y)$
Per trovare la statistica sufficiente, con il teorema di fattorizzazione subito abbiamo
$e^(-Sigma y)e^(n theta) mathbb{1}_((-oo;min (y)])(theta)$
quindi si vede subito che $T= min (y)$ è lo stimatore sufficiente.
Ora il calcolo della sua pdf dovrebbe esserti agevole (e comunque è necessaria per il punto successivo)
Completezza: qui è tutto un altro discorso; dato che il modello non è regolare, non abbiamo la certezza che lo stimatore sufficiente sia anche completo. Occorre provare o meno la completezza con la definizione. Ci sono calcoli da fare e studio sottostante. Fammi vedere i tuoi progressi e, se avrò tempo e soprattutto voglia, interverrò
Prima di proseguire mi potresti chiarire come sei passato da una produttoria di indicatrici a quella finale espressa in funzione di $\theta$. Grazie e scusa il disturbo.
nessun disturbo.
Hai un campione casuale di ampiezza n
$Y_1,...,Y_n$
ogni elemento del campione è indipendente ed ha la stessa distribuzione, quindi vale anche che
$theta<= y_1
...
$theta<= y_n
quindi $theta$ è minore del minimo delle y. A questo punto è chiaro che l'indicatrice si può esprimere sia in termini di y ma anche di $theta$, ovvero
$mathbb{1}_([theta;+oo))(y)=mathbb{1}_((-oo;min(y)])(theta)$
con la verosimiglianza espressa in questo modo si vede anche immediatamente che il nostro stimatore è anche quello di massima verosimiglianza. La produttoria delle densità è infatti una funzione strettamente crescente in $theta$, con massimo di frontiera in $hat(theta)=min(y)$
NOTA: se anche $theta$ fosse escluso dal dominio nulla cambierebbe perché lo stimatore di max verosimiglianza è l'argsup della funzione e non l'arg max
Hai un campione casuale di ampiezza n
$Y_1,...,Y_n$
ogni elemento del campione è indipendente ed ha la stessa distribuzione, quindi vale anche che
$theta<= y_1
...
$theta<= y_n
quindi $theta$ è minore del minimo delle y. A questo punto è chiaro che l'indicatrice si può esprimere sia in termini di y ma anche di $theta$, ovvero
$mathbb{1}_([theta;+oo))(y)=mathbb{1}_((-oo;min(y)])(theta)$
con la verosimiglianza espressa in questo modo si vede anche immediatamente che il nostro stimatore è anche quello di massima verosimiglianza. La produttoria delle densità è infatti una funzione strettamente crescente in $theta$, con massimo di frontiera in $hat(theta)=min(y)$
NOTA: se anche $theta$ fosse escluso dal dominio nulla cambierebbe perché lo stimatore di max verosimiglianza è l'argsup della funzione e non l'arg max
Prima di occuparci di completezza occorre trovare la densità dello stimatore $T=min(y)$
come noto (ma si dimostra in 2 passaggi) la CDF del minimo di n variabili iid è la seguente
$F_(min)(t)=1-(1-F_Y(t))^n=1-e^(n theta)e^(-nt)$
Quindi la sensità del nostro stimatore viene così
Ora passiamo alla definizione di completezza
Lo stimatore $T=T(ul(y))$ è completo se, $AA theta$
quindi calcoliamoci sto valore atteso e poniamolo uguale a zero come vuole la definizione.
Ciò implica evidentemente
deriviamo ambo i membri rispetto a $theta$
che implica evidentemente
o anche
che conclude la dimostrazione della completezza dello stimatore
come noto (ma si dimostra in 2 passaggi) la CDF del minimo di n variabili iid è la seguente
$F_(min)(t)=1-(1-F_Y(t))^n=1-e^(n theta)e^(-nt)$
Quindi la sensità del nostro stimatore viene così
$f_(min)(t)=n e^(n theta)e^(-nt)$
Ora passiamo alla definizione di completezza
Lo stimatore $T=T(ul(y))$ è completo se, $AA theta$
$mathbb{E}_theta g(T)=0 rarr mathbb{P}_theta[g(T)=0]=1$
quindi calcoliamoci sto valore atteso e poniamolo uguale a zero come vuole la definizione.
$mathbb{E}_theta g(T)=int_theta^(oo)g(t)n e^(n theta)e^(-nt)dt=0$
Ciò implica evidentemente
$int_theta^(oo)g(t)e^(-nt)dt=0$
deriviamo ambo i membri rispetto a $theta$
$-g(theta)e^(-n theta)=0$
che implica evidentemente
$g(t)=0$ ; $AA t$
o anche
$mathbb{P}_theta[g(T)=0]=1$ ; $AA theta$
che conclude la dimostrazione della completezza dello stimatore
Un quesito di analisi: quando derivi ambo i membri non dovresti avere semplicemente l'argomento dell'integrale calcolato in $\theta$?
Infatti è ciò che ho fatto. Ci va un meno davanti perché $theta$ sta all'estremo inferiore