Statistiche sufficienti
salve a tutti!
avrei bisogno di una spiegazione dettagliata di come risolvere questo esercizio sulle statistiche sufficienti; non mi è proprio chiara la partenza: io so che devo scrivere la funzione di densità ma non so proprio come fare.
Potete aiutarmi?
Modello: X distribuita come una Normale e $ \theta = ( \mu , \sigma^2 ) $
utilizzando il teorema di fattorizzazione, mostrare che il vettore delle statistiche T(X)= $ ( \sum X\imath , \sum ( X\imath )^2) $ è congiuntamente sufficiente per $ \theta $ .
spero di aver scritto bene.
avrei bisogno di una spiegazione dettagliata di come risolvere questo esercizio sulle statistiche sufficienti; non mi è proprio chiara la partenza: io so che devo scrivere la funzione di densità ma non so proprio come fare.
Potete aiutarmi?
Modello: X distribuita come una Normale e $ \theta = ( \mu , \sigma^2 ) $
utilizzando il teorema di fattorizzazione, mostrare che il vettore delle statistiche T(X)= $ ( \sum X\imath , \sum ( X\imath )^2) $ è congiuntamente sufficiente per $ \theta $ .
spero di aver scritto bene.
Risposte
Dato che il campione è casuale, ogni elemento del campione ha la stessa distribuzione uguale a quella della popolazione ed inoltre gli elementi del campione sono mutuamente indipendenti. Di conseguenza la densità del campione è semplicemente il prodotto delle funzioni di densità dei singoli elementi. Per risolvere il problema devi soltanto fattorizzare la densità congiunta del campione così come descritto dal criterio di fattorizzazione,
$f(ul(x),theta)=h(ul(x))g[t(ul(x)),theta]$
ovvero come prodotto fra una funzione che dipende solo dai dati e da un'altra funzione che dipende sia dai dati che dal parametro (o parametri) da stimare ma dipende dai dati solo attraverso una funzione. Tale funzione è lo stimatore sufficiente.
Es: prendiamo una distribuzione esponenziale negativa
$f(x)=theta e^(-thetax)$
Estraiamo un campione casuale di ampiezza $n$ e calcoliamo la densità del campione (la funzione di verosimiglianza)
$f(ul(x),theta)=theta^n e^(-theta sum_(i)x_(i))$
come vedi la distribuzione del campione è stata fattorizzata nel prodotto di due funzioni
$h(ul(x))=1$
$g(t(ul(x)),theta)=theta^n e^(-theta sum_(i)x_(i))$
e come puoi notare, la funzione $g$ dipende sia dai dati (da $ul(x)$) che dal parametro $theta$ MA DIPENDE DAI DATI SOLO ATTRAVERSO UNA FUNZIONE DI TALI DATI. Quella funzione (ovvero la somma) è lo stimatore sufficiente per $theta$.
*****************
Nel caso della normale, la densità congiunta è la seguente:
$L(ul(x),mu,sigma)=(1/(sigma^2 2 pi))^(n/2)exp{-1/2 sum_(i)((x_(i)-mu)/sigma)^2}=$
$=(1/(sigma^2 2 pi))^(n/2)exp{-1/(2sigma^2) [sum_(i)x_(i)^2-2musum_(i)x_(i)+nmu^2]}$
come puoi notare, fattorizzando la densità congiunta, si vede bene che essa dipende dai dati solo attraverso le funzioni $Sigmax$ e $Sigmax^2$. Pertanto esse sono congiuntamente sufficienti per $mu$ e $sigma^2$.
Dato poi che $bar(x)$ e $S^2$ sono funzioni biunivoche delle funzioni sufficienti trovate, per una nota proprietà delle statistiche sufficienti, anch'esse sono congiuntamente sufficienti per $mu$ e $sigma^2$.
spero sia SUFFICIENTEMENTE chiaro
buon lavoro
$f(ul(x),theta)=h(ul(x))g[t(ul(x)),theta]$
ovvero come prodotto fra una funzione che dipende solo dai dati e da un'altra funzione che dipende sia dai dati che dal parametro (o parametri) da stimare ma dipende dai dati solo attraverso una funzione. Tale funzione è lo stimatore sufficiente.
Es: prendiamo una distribuzione esponenziale negativa
$f(x)=theta e^(-thetax)$
Estraiamo un campione casuale di ampiezza $n$ e calcoliamo la densità del campione (la funzione di verosimiglianza)
$f(ul(x),theta)=theta^n e^(-theta sum_(i)x_(i))$
come vedi la distribuzione del campione è stata fattorizzata nel prodotto di due funzioni
$h(ul(x))=1$
$g(t(ul(x)),theta)=theta^n e^(-theta sum_(i)x_(i))$
e come puoi notare, la funzione $g$ dipende sia dai dati (da $ul(x)$) che dal parametro $theta$ MA DIPENDE DAI DATI SOLO ATTRAVERSO UNA FUNZIONE DI TALI DATI. Quella funzione (ovvero la somma) è lo stimatore sufficiente per $theta$.
*****************
Nel caso della normale, la densità congiunta è la seguente:
$L(ul(x),mu,sigma)=(1/(sigma^2 2 pi))^(n/2)exp{-1/2 sum_(i)((x_(i)-mu)/sigma)^2}=$
$=(1/(sigma^2 2 pi))^(n/2)exp{-1/(2sigma^2) [sum_(i)x_(i)^2-2musum_(i)x_(i)+nmu^2]}$
come puoi notare, fattorizzando la densità congiunta, si vede bene che essa dipende dai dati solo attraverso le funzioni $Sigmax$ e $Sigmax^2$. Pertanto esse sono congiuntamente sufficienti per $mu$ e $sigma^2$.
Dato poi che $bar(x)$ e $S^2$ sono funzioni biunivoche delle funzioni sufficienti trovate, per una nota proprietà delle statistiche sufficienti, anch'esse sono congiuntamente sufficienti per $mu$ e $sigma^2$.
spero sia SUFFICIENTEMENTE chiaro
buon lavoro
In sostanza io devo sapere di mio la funzione densità a seconda della distribuzione e di lì vedere se è rispettato il criterio di fattorizzazione?
La distribuzione Normale ha un certo tipo di densità, come anche la Binomiale, la Poisson,...
La distribuzione Normale ha un certo tipo di densità, come anche la Binomiale, la Poisson,...