Esercizio su stimatori distorti
buonasera,
mi sono imbattuto in un esercizio che mi ha sollevato un paio di quesiti:
Sia X1,...,Xn v.a. i.i.d. con distribuzione di legge Geometrica(p) con$ p ∈ (0,1)$
dopo aver statistica suff minim completa (appartiene a fam esponenziale) e aver trovato stimatore MLE di p
se non ho sbagliato tutto $ tilde(p)=n/(sum(x)) $
mi rimangono questi punti:
(c) Si discuta consistenza, asintotica normalit`a e asintotica efficienza dib p;
per questo chiedo semplicemente dove poter trovare un testo che li spieghi chiaramente e qualche esercizio base siccome non li ho affrontati personalmente durante il corso.
(d) Si proponga uno stimatore non distorto per p;
qua sorge il problema: perche sia non distorto si necessita $E(tilde(p))=p $
ossia mi devo calcolare $ int_(a)^(b) t*fp(t) dt $ e poi correggere lo stimatore (per il principio di invarianza credo) in modo che esca esattamente uguale al paramentro che cerco di stimare.
le mie perplessita sono:
1) in questo caso in cui ho sommatoria di v.a. i.i.d esponenziali posso scrivere la legge di $fp(t)$ come quella della funzione di distribuzione Gamma(n,theta)? ( mi sono ricondotto a famiglia esponenziale tramite
$e^(ln(f(x)))$ dove f(x) è la distribuzione della geometrica e i dovuti calcoli algebrici)
il fatto che lo stimatore sia inverso della sommatoria moltiplicato per n non va a modificare la funzione della distribuzione?
in tal caso come mai?
2) se non potessi (o non volessi) passare tramite Gamma(n,t) credo debba calcolarmi la funzione di ripartizione tramite la definizione $Fp(t)=P(p<=t)$ e poi derivarla in dt per trovare la densità ma come calcolo la probabilita che l'inverso della media campionaria sia minore uguale di t?
3) la terza strada che ho tentato (anche questa miseramente) è stata di utilizzare la trasformazione di variabili continue:
$ fy(y)=fx(g^-1(y))*abs(d/dy(g^(-1)(y)) $
che credo faccia al caso mio ma non ho assutamente idea di come applicarla.
grazie mille per l'aiuto, a voi che portate un po' di luce nella mia fosca conoscenza di statista
mi sono imbattuto in un esercizio che mi ha sollevato un paio di quesiti:
Sia X1,...,Xn v.a. i.i.d. con distribuzione di legge Geometrica(p) con$ p ∈ (0,1)$
dopo aver statistica suff minim completa (appartiene a fam esponenziale) e aver trovato stimatore MLE di p
se non ho sbagliato tutto $ tilde(p)=n/(sum(x)) $
mi rimangono questi punti:
(c) Si discuta consistenza, asintotica normalit`a e asintotica efficienza dib p;
per questo chiedo semplicemente dove poter trovare un testo che li spieghi chiaramente e qualche esercizio base siccome non li ho affrontati personalmente durante il corso.
(d) Si proponga uno stimatore non distorto per p;
qua sorge il problema: perche sia non distorto si necessita $E(tilde(p))=p $
ossia mi devo calcolare $ int_(a)^(b) t*fp(t) dt $ e poi correggere lo stimatore (per il principio di invarianza credo) in modo che esca esattamente uguale al paramentro che cerco di stimare.
le mie perplessita sono:
1) in questo caso in cui ho sommatoria di v.a. i.i.d esponenziali posso scrivere la legge di $fp(t)$ come quella della funzione di distribuzione Gamma(n,theta)? ( mi sono ricondotto a famiglia esponenziale tramite
$e^(ln(f(x)))$ dove f(x) è la distribuzione della geometrica e i dovuti calcoli algebrici)
il fatto che lo stimatore sia inverso della sommatoria moltiplicato per n non va a modificare la funzione della distribuzione?
in tal caso come mai?
2) se non potessi (o non volessi) passare tramite Gamma(n,t) credo debba calcolarmi la funzione di ripartizione tramite la definizione $Fp(t)=P(p<=t)$ e poi derivarla in dt per trovare la densità ma come calcolo la probabilita che l'inverso della media campionaria sia minore uguale di t?
3) la terza strada che ho tentato (anche questa miseramente) è stata di utilizzare la trasformazione di variabili continue:
$ fy(y)=fx(g^-1(y))*abs(d/dy(g^(-1)(y)) $
che credo faccia al caso mio ma non ho assutamente idea di come applicarla.
grazie mille per l'aiuto, a voi che portate un po' di luce nella mia fosca conoscenza di statista

Risposte
Premesso che quando si parla di Legge Geometrica sarebbe opportuno scriverne anche la pmf in quanto che ne esistono due diverse parametrizzazioni (una che conta le prove necessaria ad ottenere il primo successo, l'altra che ne conta i fallimenti), lo stimatore che hai trovato è giusto.
Visto lo stimatore, è anche chiaro che ti riferisci alla legge che conta il numero di prove necessarie per ottenere il primo successo.
[ot]E' un dettaglio, ma non si può dire
perché MLE è l'acronimo di Maximun Likelihood Estimator, quindi sarebbe come dire: viaggiare a 10 km all'ora all'ora....[/ot]
Per il punto c) va bene qualunque testo di Statistica base[nota]ecco una dispensina molto ma molto ben fatta, sebbene riassuntiva, con tutti i riferimenti ai principali testi alla fine. Proprietà dei MLE a pag 17[/nota] al paragrafo: proprietà asintotiche degli stimatori di massima verosimiglianza (per la prima proprietà basta dimostrare la convergenza in probabilità dello stimatore, WLLN)
Per lo stimatore non distorto sei totalmente fuori strada.
...mica puoi confondere "Distribuzione esponenziale negativa[nota]Una certa Legge di probabilità, tra l'altro continua....[/nota] " con "Famiglia esponenziale[nota]Una famiglia di Leggi (discrete e continue) che, ammettendo una determinata rappresentazione, condividono alcune importanti proprietà come ad esempio la Completezza[/nota] "
Se $(X_1,...,X_n)$ sono variabili iid distribuite come una $Ge(p)$ è noto che $Y=Sigma_i X_i$ si distribuisce come una binomiale negativa.
Uno stimatore non distorto per $p$ è $hat(p)=(n-1)/(y-1)$ e lo si vede facilmente così:
$mathbb{E}_p[(n-1)/(y-1)]=sum_(y=n)^(+oo)(n-1)/(y-1)((y-1),(n-1))p^n(1-p)^(y-n)=$
$=psum_(y-1=n-1)^(+oo)((y-2),(n-2))p^(n-1)(1-p)^[(y-1)-(n-1)]=psum_(w=m)^(+oo)((w-1),(m-1))p^m(1-p)^(w-m)=p$
Essendo non distorto e funzione di uno stimatore sufficiente e completo è anche UMVUE
Per chiarirti la questione ti potrebbe interessare questo topic
Visto lo stimatore, è anche chiaro che ti riferisci alla legge che conta il numero di prove necessarie per ottenere il primo successo.
[ot]E' un dettaglio, ma non si può dire
"reggi96":
dopo aver trovato stimatore MLE di p
perché MLE è l'acronimo di Maximun Likelihood Estimator, quindi sarebbe come dire: viaggiare a 10 km all'ora all'ora....[/ot]
Per il punto c) va bene qualunque testo di Statistica base[nota]ecco una dispensina molto ma molto ben fatta, sebbene riassuntiva, con tutti i riferimenti ai principali testi alla fine. Proprietà dei MLE a pag 17[/nota] al paragrafo: proprietà asintotiche degli stimatori di massima verosimiglianza (per la prima proprietà basta dimostrare la convergenza in probabilità dello stimatore, WLLN)
Per lo stimatore non distorto sei totalmente fuori strada.
"reggi96":
1) in questo caso in cui ho sommatoria di v.a. i.i.d esponenziali


Se $(X_1,...,X_n)$ sono variabili iid distribuite come una $Ge(p)$ è noto che $Y=Sigma_i X_i$ si distribuisce come una binomiale negativa.
Uno stimatore non distorto per $p$ è $hat(p)=(n-1)/(y-1)$ e lo si vede facilmente così:
$mathbb{E}_p[(n-1)/(y-1)]=sum_(y=n)^(+oo)(n-1)/(y-1)((y-1),(n-1))p^n(1-p)^(y-n)=$
$=psum_(y-1=n-1)^(+oo)((y-2),(n-2))p^(n-1)(1-p)^[(y-1)-(n-1)]=psum_(w=m)^(+oo)((w-1),(m-1))p^m(1-p)^(w-m)=p$
Essendo non distorto e funzione di uno stimatore sufficiente e completo è anche UMVUE
Per chiarirti la questione ti potrebbe interessare questo topic
forse non ho capito a fondo la teoria... mi spiego meglio: io pensavo che trovata la statistica sufficiente $ sum(x) $ e il mle $ n/(sum(x)) $ per trovare lo stimatore non distorto dovessi calcolarmi il valore atteso di questo'ultimo modificandolo per ottenerne uno non distorto per il principio di invarianza poi tramite Lehmann-Scheffè trovare l'umvue.
non capisco perche utilizzi questa formula
non capisco il perche analizzare $ Y=Sigma_i X_i $ e non $Y = n/(Sigma_i x_i)$
la mia principale perplessita consiste in come trattare l'MLE trovato per renderlo non distorto
ossia dal tuo procedimento sembra che tu abbia gia trovato in qualche modo( che non riesco a capire) lo stimatore non distorto e ne abbia solo fatto un controllo.
a me manca il passaggio prima ossia come fai a dire
l'ultimo grande dubbio che mi rimane evidendentemente per non aver compreso fino in fondo la teoria è quale funzione di densita usare nel valor atteso dello stimatore? da qui tutte queste domande
p.s.posto che grazie per avermi puntualizzato la differenza tra distribuzione esponenziale negativa e famiglia esponenziale che nella mia testa mi si erano mischiate.
p.p.s bellissima la dispensa
non capisco perche utilizzi questa formula
"tommik":
Se $ (X_1,...,X_n) $ sono variabili iid distribuite come una $ Ge(p) $ è noto che $ Y=Sigma_i X_i $ si distribuisce come una binomiale negativa.
Uno stimatore non distorto per $ p $ è $ hat(p)=(n-1)/(y-1) $
non capisco il perche analizzare $ Y=Sigma_i X_i $ e non $Y = n/(Sigma_i x_i)$
la mia principale perplessita consiste in come trattare l'MLE trovato per renderlo non distorto
ossia dal tuo procedimento sembra che tu abbia gia trovato in qualche modo( che non riesco a capire) lo stimatore non distorto e ne abbia solo fatto un controllo.
a me manca il passaggio prima ossia come fai a dire
"tommik":
Uno stimatore non distorto per $ p $ è $ hat(p)=(n-1)/(y-1) $
l'ultimo grande dubbio che mi rimane evidendentemente per non aver compreso fino in fondo la teoria è quale funzione di densita usare nel valor atteso dello stimatore? da qui tutte queste domande
"reggi96":
il fatto che lo stimatore sia inverso della sommatoria moltiplicato per n non va a modificare la funzione della distribuzione?
in tal caso come mai?
2) se non potessi (o non volessi) passare tramite Gamma(n,t)[nota]ho capito gamma non ha senso ma sostituiamola con la binomiale e la domanda rimane valida[/nota] credo debba calcolarmi la funzione di ripartizione tramite la definizione $ Fp(t)=P(p<=t) $ e poi derivarla in dt per trovare la densità ma come calcolo la probabilita che l'inverso della media campionaria sia minore uguale di t?
3) la terza strada che ho tentato (anche questa miseramente) è stata di utilizzare la trasformazione di variabili continue:
$ fy(y)=fx(g^-1(y))*abs(d/dy(g^(-1)(y)) $
che credo faccia al caso mio ma non ho assutamente idea di come applicarla.
p.s.posto che grazie per avermi puntualizzato la differenza tra distribuzione esponenziale negativa e famiglia esponenziale che nella mia testa mi si erano mischiate.
p.p.s bellissima la dispensa
Il metodo che vuoi usare tu per trovare l'UMVUE può andare bene ma può risultare molto molto complesso. La procedura migliore te l'ho indicata in questo link che forse non hai letto per bene. Se noti, nel campionamento inverso, con la geometrica, esce esattamente lo stesso stimatore che ti ho indicato io.
Ciò premesso ho fatto una scorciatoia. Sapendo che la distribuzione di $Y=Sigma_i X_i$ è questa
$mathbb{P}[Y=y]=((y-1),(n-1))p^n(1-p)^(y-n)$, $y=n,n+1,n+2,....$
viene naturale scegliere come stimatore $hat(p)=(n-1)/(y-1)$ e diventa anche molto semplice calcolare
$mathbb{E}[hat(p)]=mathbb{E}[g(y)]=Sigma g(y)p(y)$
magari ci sono altre strade, ma più complesse....io di mestiere faccio il contabile e mi arrangio come posso....
Sempre sulla tecnica per cercare l'UMVUE puoi guardare anche questo.
può essere complicato calcolare il valore atteso dello stimatore di MV, correggerlo, e poi passare a Lehmann Scheffé. E' più pratico cercare uno stimatore qualunque non distorto, anche molto semplice e poi, via Rao Blackwell & Lehmann Scheffé fare il resto....IMHO
Ciò premesso ho fatto una scorciatoia. Sapendo che la distribuzione di $Y=Sigma_i X_i$ è questa
$mathbb{P}[Y=y]=((y-1),(n-1))p^n(1-p)^(y-n)$, $y=n,n+1,n+2,....$
viene naturale scegliere come stimatore $hat(p)=(n-1)/(y-1)$ e diventa anche molto semplice calcolare
$mathbb{E}[hat(p)]=mathbb{E}[g(y)]=Sigma g(y)p(y)$
magari ci sono altre strade, ma più complesse....io di mestiere faccio il contabile e mi arrangio come posso....
Sempre sulla tecnica per cercare l'UMVUE puoi guardare anche questo.
può essere complicato calcolare il valore atteso dello stimatore di MV, correggerlo, e poi passare a Lehmann Scheffé. E' più pratico cercare uno stimatore qualunque non distorto, anche molto semplice e poi, via Rao Blackwell & Lehmann Scheffé fare il resto....IMHO
avevo letto il topic ed è molto interessante come metodo io purtroppo sono legato ai punti standard dei tde che devo affrontare però quindi non sono libero di trovare direttamente l'umvue, devo complicarmi la vita e trovare uno stimatore distorto per poi renderlo non distorto e poi applicare il teorema...
grazie mille di todos gentilissimo
grazie mille di todos gentilissimo

"reggi96":
non capisco il perche analizzare $ Y=Sigma_i X_i $ e non $Y = n/(Sigma_i x_i)$
Perché la distribuzione di $ Y=Sigma_i X_i $ è nota, l'altra no.
"reggi96":
purtroppo sono legato ai punti standard dei tde che devo affrontare però quindi non sono libero di trovare direttamente l'umvue, devo complicarmi la vita e trovare uno stimatore distorto per poi renderlo non distorto e poi applicare il teorema...
Ne dubito fortemente. Tu sei obbligato a rispondere esattamente alla domanda che ti viene fatta, solo che spesso la comprensione del testo viene fatta superficialmente e si tende a rispondere ad una domanda diversa, spesso anche più complicata di quanto non sia. Inoltre non sempre lo stimatore distorto si può correggere. Il metodo che ti ho mostrato è il più efficace e descritto sui migliori manuali di statistica (che trovi tutti elencati nell'ultima pagina della dispensa che ti ho linkato).
Leggendo bene la traccia
"reggi96":
(d) Si proponga uno stimatore non distorto per p;
...non si dice da nessuna parte che tu debba partire dal MLE per proporre uno stimatore non distorto o che tu debba proporre uno stimatore non distorto, consistente, efficiente ecc ecc...diverso sarebbe stato il caso in cui la domanda fosse stata: "partendo dallo stimatore di MV, proporre uno stimatore non distorto per p"
Questa è una tua convinzione ma il testo non chiede questo....e quindi potresti proporne uno qualunque di stimatore non distorto, ad esempio questo
$hat(p)=mathbb{1}_({1})(X_1)$
Cioè uno stimatore che vale 1 se la prima osservazione del campione vale 1 e zero altrove....
E' evidente che $mathbb{E}[hat(p)]=1xxp+0xx(1-p)=p$
e quindi abbiamo già risposto alla domanda della traccia senza alcuno spargimento di sangue.
Se proprio vuoi farti del male e partire dal MLE, calcolarne il valore atteso, correggerlo ecc ecc dovresti comunque porre $Y=Sigma_i X_i$ e risolvere
$mathbb{E}[n/(Sigma_i X_i)]=sum_(y=n)^(+oo)n/y ((y-1),(n-1))p^n(1-p)^(y-n)$
a questo punto vedi che le cose si complicano inutilmente e risulta davvero naturale scegliere lo stimatore che ti ho proposto io fin da subito: $hat(p)=(n-1)/(y-1)$...perché si vede che è facilissimo calcolarne il valore atteso e, per $n$ sufficientemente grande, non è molto diverso da $n/y$
Ora ti faccio un'altra domanda, collegata alla traccia.
Qui la risposta è Sì oppure No...non si chiede di calcolare esplicitamente $mathbb{E}[hat(p)]=mathbb{E}[n/(Sigma_i X_i)]$
Ciò sarebbe richiesto se la domanda fosse stata
Le parole sono importanti, ed una virgola può cambiare il senso di una frase o il contenuto di un contratto
ES:
San Francesco dormiva con una vecchia, coperta di pelo
Oppure:
San Francesco dormiva con una vecchia coperta, di pelo
...le due frasi non hanno lo stesso significato!
Tornando alla domanda 1), si può stabilire se lo stimatore è distorto oppure no anche senza fare tanti conti...
Nota che $mathbb{E}[Sigma_i X_i]=n/p$
e quindi $n/(mathbb{E}[Sigma_i X_i])=p$
ma per la disuguaglianza di Jensen sappiamo anche che $g(mathbb{E][X] )!=mathbb{E}[g(X)]$ e quindi $mathbb{E}[n/(Sigma_i X_i)] !=p$ ovvero è distorto....senza dover fare lunghi e complicati conti
1) Dopo aver calcolato l'MLE per $p$ stabilire se esso è distorto oppure no
Qui la risposta è Sì oppure No...non si chiede di calcolare esplicitamente $mathbb{E}[hat(p)]=mathbb{E}[n/(Sigma_i X_i)]$
Ciò sarebbe richiesto se la domanda fosse stata
2) Dopo aver calcolato il valore atteso dell'MLE per $p$ stabilire se esso è distorto oppure no
Le parole sono importanti, ed una virgola può cambiare il senso di una frase o il contenuto di un contratto
ES:
San Francesco dormiva con una vecchia, coperta di pelo
Oppure:
San Francesco dormiva con una vecchia coperta, di pelo
...le due frasi non hanno lo stesso significato!
Tornando alla domanda 1), si può stabilire se lo stimatore è distorto oppure no anche senza fare tanti conti...
Nota che $mathbb{E}[Sigma_i X_i]=n/p$
e quindi $n/(mathbb{E}[Sigma_i X_i])=p$
ma per la disuguaglianza di Jensen sappiamo anche che $g(mathbb{E][X] )!=mathbb{E}[g(X)]$ e quindi $mathbb{E}[n/(Sigma_i X_i)] !=p$ ovvero è distorto....senza dover fare lunghi e complicati conti
ok mi stavo autocomplicando la vita senza motivo,
non so per quale motivo non ho pensato che lo stimatore non distorto non deve per forza avere qualcosa a che fare con la distribuzione su cui sto lavorando, quindi posso scegliere quello che mi fa piu comodo che rispetti la definizione e dipenda dai dati in qualcunque modo corretto?
farò piu attenzione a rispondere esattamente alle richieste senza complicarmi la vita. grazie mille
non so per quale motivo non ho pensato che lo stimatore non distorto non deve per forza avere qualcosa a che fare con la distribuzione su cui sto lavorando, quindi posso scegliere quello che mi fa piu comodo che rispetti la definizione e dipenda dai dati in qualcunque modo corretto?
farò piu attenzione a rispondere esattamente alle richieste senza complicarmi la vita. grazie mille

un'altra domanda perdonami, nel caso non abbia una distribuzione nota come posso proporre stimatore non distorto con dipendenza dai dati?
Non so rispondere. Ogni esercizio è a sé. Occorre leggere bene la traccia, aver ben studiato la teoria e trovare la via più consona. Gli esercizi proposti sono fatti apposta per essere risolti...quindi una via c'è sempre. Cerca un po' di esercizi e prova a risolverli...io ne ho una marea
ok grazie mille davvero
