Stima bayesiana con distribuzione a priori in un intervallo dato

khnum1
ciao, ho un problema con questo esercizio:

Siano x1... xk campioni indipendenti estratti da una distribuzione binomiale di parametro p incognito
e n noto. Impostare il problema della stima e stimare i parametri della distribuzione usando i tre diversi
approcci per la costruzione di stimatori (metodo dei momenti, massima verosimiglianza, stima
bayesiana scegliendo un’opportuna prior assumendo che a priori il parametro p si pensa essere
con buona probabilita nell’intervallo [0.4 0.6]).

non ho problemi per quanto riguarda la parte col metodo dei momenti e ML, mentre nella parte di stima bayesiana, [highlight]non saprei come scegliere la funzione a priori in modo che stia nell' intervallo detto[/highlight].

avrei pensato di considerare la prior come una $f(p) = \beta(a,b)$ e quindi di verificare che $\int_0.4^0.6f(p)dp = 0.95$ , considerando la "buona probabilità" come il 95%.
A questo punto i problemi sono 2: 1° non so come risolvere l 'integrale della beta, 2° penso che anche se arrivassi ad una soluzione potrei al massimo definire $a = f(b)$ .
Esistono altre strade?

Risposte
Lo_zio_Tom
ciao, beniscritto!

Non ti chiede di fissare al 95% la probabilità della prior....il parametro ha una buona probabilità di essere fra 0.4 e 0.6

Quindi ad esempio una Beta di media 0.5 con appunto "una buona probabilità" di essere fra 0.4 e 0.6.

Ad esempio una $pi(theta)~"Beta"(5;5)$ che porge $int_(0.4)^(0.6)630*theta^4(1-theta)^4d theta~~0.5$

se vuoi aumentare questa probabilità (quindi aumentare il peso delle informazioni a priori) basta aumentare i parametri della beta, ad esempio con una

$pi(theta)~"Beta"(40,40)$

ottieni $int_(0.4)^(0.6) (79!)/(39!39!)theta^(39)(1-theta)^39 d theta~~0.93$

Guardando i grafici della beta ti accorgi che, scegliendo i due parametri $a=b$ ottieni una densità simmetrica a forma di campana che quindi massimizza la probabilità dei valori intorno alla media di $0.5$: è proprio ciò che fa per noi!

Dato che l'esercizio non dice quanto "buona" deve essere la probabilità delle informazioni a priori, fissiamo ad esempio un valore di 80%

A questo punto ricordando che, se $a=b$, i valori di sintesi della beta sono $E[theta]=1/2$ e $V[theta]=1/(4(2a+1))$, possiamo anche approssimare la probabilità cercata con una gaussiana, ottenendo

$P(0.4
$P[Z<(0.6-0.5)*2*sqrt(2a+1)]=0.9$

$0.2sqrt(2a+1)=1.28 rarr a~~20$

E quindi scegliamo una prior $pi(theta)~"Beta"(20,20)$

A questo punto hai che

$pi(theta)prop theta^19(1-theta)^19$

con un modello binomiale...

$p(ul(x)|theta )prop theta^(Sigmax) (1-theta)^(n-Sigmax)$

Quindi con una posterior:

$pi(theta|ul(x))prop theta^(Sigmax+19)(1-theta)^(n-Sigmax+19)~"Beta"(20+Sigmax,20+n-Sigmax)$

la stima del parametro a posteriori con il minimo MSE è la media della posterior

$hat(theta)_(MMSE)=E[theta|ul(x)]=(20+Sigmax)/(40+n)$


Volendo puoi calcolare anche lo stimatore MAP (Maximum A Posteriori) massimizzando la posterior....

khnum1
grazie credo di aver capito :smt023

ho però un altro dubbio su un esercizio simile:
Siano x1... xk campioni indipendenti estratti da una distribuzione di [highlight]Poisson[/highlight] di parametro $\lambda$ incognito. Impostare il problema della stima di $\lambda$ ..... scegliendo un'opportuna prior sapendo che in base ad informazioni precedenti si pensava che il parametro fosse compreso al 95% nell'intervallo [10 15].

il problema è sempre su come trovare la prior.
in questo caso la coniugata della Poisson è la $\Gamma$

esattamente come prima mi verrebbe da porre $f(\lambda) = \Gamma(a,b)$

e quindi di provare a risolvere: $\int_10^15f(\lambda) d\lambda =0.95$

anche qui però non conosco i parametri a,b della $\Gamma$, quindi non riuscirei a svolgere l'integrale

in questo caso come si fa?

Lo_zio_Tom
la Gamma si standardizza in una $chi^2$ e per trovare i valori di $a$ e $b$ si usano le tavole

a me esce ad esempio

$pi(theta)="Gamma"(94;7.6)$

EDIT

in realtà dovresti risovere le seguenti disuguaglianze (supponendo ovviamente di impostare il problema con code equiprobabili, altrimenti ciccia perché ci sarebbero comunque infinite soluzioni)

$
{{: ( int_0^(10)b^a/(Gamma(a))theta^(a-1)e^(-b theta)d theta=0.025 ),( int_0^(15)b^a/(Gamma(a))theta^(a-1)e^(-b theta)d theta=0.975 ) :}$

che onestamente non mi sembrano di facile soluzione.....allora ho ragionato così:

Devo calcolare i parametri della gamma in modo che

$P(10
Allora mi accorgo che se $theta~"Gamma(a,b)$ allora $Y=2b theta~chi_((2a))^2$

Quindi cerco di calcolare i parametri della chi quadro tali per cui

$P(20b
sfogliando una qualunque tavola, cerco quindi fra le colonne delle probabilità 0.025 e 0.975 a cui corrispondono dei quantili tali per cui il maggiore sia una volta e mezza il minore....e mi accorgo che i gdl vanno oltre i 100; non avendo la tavola disponibile per gdl così elevati me la tabulo su Excel (ci vuole davvero poco) e così mi accorgo che il giochino funziona con 188 gdl, ovvero con un $a=188/2=94$ e con i due quantili che sono rispettivamente 152 e 228, ovvero $b=7.6$

Questa è la soluzione esatta e la probabilità cercata viene:

$P(10
Ovviamente il tutto si poteva risolvere con un'approssimazione gaussiana

Infatti, una volta visto che i gdl sono superiori ai 100 bastava risolvere il seguente sistema

${{: ( (30b-k)/sqrt(2k)=1.96 ),( (20b-k)/sqrt(2k)=-1.96) :}$

dove b è il nostro b e k sono i gdl, ovvero $2a$

Con questa approssimazione la probabilità richiesta viene 95.13% ma risolvi il tutto in 3 secondi e mezzo ottenendo

$a=192/2=96$ e $b=7.7$

...direi che ci siamo

:smt023


PS: che cosa studi?

khnum1
quindi, correggimi se sbaglio

dalle proprietà della $\Gamma$ so che: $\Gamma(a/2; 1/2) = \chi^2(a)$
visto che io avrei $\lambda ~\Gamma(a;b)$, per ottenere la forma della $\chi^2$ devo porre $y = 2b\lambda$
in questo modo avrei $y~\Gamma(a;1/2) = \Gamma(2a/2;1/2) = \chi^2(2a)$

ora potrei passare a verificare che $P(10<\lambda<15) = 0.95$ che diventerà $P(20b
quindi prendo le tavole della $\chi^2$, se uso 2 code guardo i valori per 0.975 e 0.025. scelgo i gradi di libertà che voglio (??), ad esempio 50 e ottengo $P(y<32.3) ~~ 2.5%$ e $P(y>71.42) ~~ 2.5%$

perciò visto che il parametro della $\chi^2$ sono i gradi di libertà ho che: $a=25$ e $b = 71.42/30 = 2.38$

[highlight]ho letto adesso la risposta, ma intanto stavo scrivendo questo quindi te lo invio comunque.[/highlight]

"cerco quindi fra le colonne a cui corrispondono le probabilità 0.025 e 0.975 dei quantili dove il maggiore sia una volta e mezza il minore" quello che mi mancava era questo.
Adesso ho capito tutto, grazie davvero!! :D

PS: studio ingegneria :roll:

Lo_zio_Tom
"khnum":

[highlight]ho letto adesso la risposta, ma intanto stavo scrivendo questo quindi te lo invio comunque.[/highlight]


Hai fatto benissimo! Postare questi tentativi di soluzione è proprio nello spirito del forum, anzi è obbligatorio.
Sono io che in questo caso ho risposto troppo in fretta, senza aspettare il tuo intervento, perché sto andando in vacanza per il week end e non volevo lasciare il problema in sospeso....

Alla (settimana) prossima!

:drinkers:

khnum1
grazie mille!!!! :D :smt023

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.