Stima bayesiana con distribuzione a priori in un intervallo dato
ciao, ho un problema con questo esercizio:
Siano x1... xk campioni indipendenti estratti da una distribuzione binomiale di parametro p incognito
e n noto. Impostare il problema della stima e stimare i parametri della distribuzione usando i tre diversi
approcci per la costruzione di stimatori (metodo dei momenti, massima verosimiglianza, stima
bayesiana scegliendo un’opportuna prior assumendo che a priori il parametro p si pensa essere
con buona probabilita nell’intervallo [0.4 0.6]).
non ho problemi per quanto riguarda la parte col metodo dei momenti e ML, mentre nella parte di stima bayesiana, [highlight]non saprei come scegliere la funzione a priori in modo che stia nell' intervallo detto[/highlight].
avrei pensato di considerare la prior come una $f(p) = \beta(a,b)$ e quindi di verificare che $\int_0.4^0.6f(p)dp = 0.95$ , considerando la "buona probabilità" come il 95%.
A questo punto i problemi sono 2: 1° non so come risolvere l 'integrale della beta, 2° penso che anche se arrivassi ad una soluzione potrei al massimo definire $a = f(b)$ .
Esistono altre strade?
Siano x1... xk campioni indipendenti estratti da una distribuzione binomiale di parametro p incognito
e n noto. Impostare il problema della stima e stimare i parametri della distribuzione usando i tre diversi
approcci per la costruzione di stimatori (metodo dei momenti, massima verosimiglianza, stima
bayesiana scegliendo un’opportuna prior assumendo che a priori il parametro p si pensa essere
con buona probabilita nell’intervallo [0.4 0.6]).
non ho problemi per quanto riguarda la parte col metodo dei momenti e ML, mentre nella parte di stima bayesiana, [highlight]non saprei come scegliere la funzione a priori in modo che stia nell' intervallo detto[/highlight].
avrei pensato di considerare la prior come una $f(p) = \beta(a,b)$ e quindi di verificare che $\int_0.4^0.6f(p)dp = 0.95$ , considerando la "buona probabilità" come il 95%.
A questo punto i problemi sono 2: 1° non so come risolvere l 'integrale della beta, 2° penso che anche se arrivassi ad una soluzione potrei al massimo definire $a = f(b)$ .
Esistono altre strade?
Risposte
ciao, beniscritto!
Non ti chiede di fissare al 95% la probabilità della prior....il parametro ha una buona probabilità di essere fra 0.4 e 0.6
Quindi ad esempio una Beta di media 0.5 con appunto "una buona probabilità" di essere fra 0.4 e 0.6.
Ad esempio una $pi(theta)~"Beta"(5;5)$ che porge $int_(0.4)^(0.6)630*theta^4(1-theta)^4d theta~~0.5$
se vuoi aumentare questa probabilità (quindi aumentare il peso delle informazioni a priori) basta aumentare i parametri della beta, ad esempio con una
$pi(theta)~"Beta"(40,40)$
ottieni $int_(0.4)^(0.6) (79!)/(39!39!)theta^(39)(1-theta)^39 d theta~~0.93$
Guardando i grafici della beta ti accorgi che, scegliendo i due parametri $a=b$ ottieni una densità simmetrica a forma di campana che quindi massimizza la probabilità dei valori intorno alla media di $0.5$: è proprio ciò che fa per noi!
Dato che l'esercizio non dice quanto "buona" deve essere la probabilità delle informazioni a priori, fissiamo ad esempio un valore di 80%
A questo punto ricordando che, se $a=b$, i valori di sintesi della beta sono $E[theta]=1/2$ e $V[theta]=1/(4(2a+1))$, possiamo anche approssimare la probabilità cercata con una gaussiana, ottenendo
$P(0.4
$P[Z<(0.6-0.5)*2*sqrt(2a+1)]=0.9$
$0.2sqrt(2a+1)=1.28 rarr a~~20$
E quindi scegliamo una prior $pi(theta)~"Beta"(20,20)$
A questo punto hai che
$pi(theta)prop theta^19(1-theta)^19$
con un modello binomiale...
$p(ul(x)|theta )prop theta^(Sigmax) (1-theta)^(n-Sigmax)$
Quindi con una posterior:
$pi(theta|ul(x))prop theta^(Sigmax+19)(1-theta)^(n-Sigmax+19)~"Beta"(20+Sigmax,20+n-Sigmax)$
la stima del parametro a posteriori con il minimo MSE è la media della posterior
$hat(theta)_(MMSE)=E[theta|ul(x)]=(20+Sigmax)/(40+n)$
Volendo puoi calcolare anche lo stimatore MAP (Maximum A Posteriori) massimizzando la posterior....
Non ti chiede di fissare al 95% la probabilità della prior....il parametro ha una buona probabilità di essere fra 0.4 e 0.6
Quindi ad esempio una Beta di media 0.5 con appunto "una buona probabilità" di essere fra 0.4 e 0.6.
Ad esempio una $pi(theta)~"Beta"(5;5)$ che porge $int_(0.4)^(0.6)630*theta^4(1-theta)^4d theta~~0.5$
se vuoi aumentare questa probabilità (quindi aumentare il peso delle informazioni a priori) basta aumentare i parametri della beta, ad esempio con una
$pi(theta)~"Beta"(40,40)$
ottieni $int_(0.4)^(0.6) (79!)/(39!39!)theta^(39)(1-theta)^39 d theta~~0.93$
Guardando i grafici della beta ti accorgi che, scegliendo i due parametri $a=b$ ottieni una densità simmetrica a forma di campana che quindi massimizza la probabilità dei valori intorno alla media di $0.5$: è proprio ciò che fa per noi!
Dato che l'esercizio non dice quanto "buona" deve essere la probabilità delle informazioni a priori, fissiamo ad esempio un valore di 80%
A questo punto ricordando che, se $a=b$, i valori di sintesi della beta sono $E[theta]=1/2$ e $V[theta]=1/(4(2a+1))$, possiamo anche approssimare la probabilità cercata con una gaussiana, ottenendo
$P(0.4
$P[Z<(0.6-0.5)*2*sqrt(2a+1)]=0.9$
$0.2sqrt(2a+1)=1.28 rarr a~~20$
E quindi scegliamo una prior $pi(theta)~"Beta"(20,20)$
A questo punto hai che
$pi(theta)prop theta^19(1-theta)^19$
con un modello binomiale...
$p(ul(x)|theta )prop theta^(Sigmax) (1-theta)^(n-Sigmax)$
Quindi con una posterior:
$pi(theta|ul(x))prop theta^(Sigmax+19)(1-theta)^(n-Sigmax+19)~"Beta"(20+Sigmax,20+n-Sigmax)$
la stima del parametro a posteriori con il minimo MSE è la media della posterior
$hat(theta)_(MMSE)=E[theta|ul(x)]=(20+Sigmax)/(40+n)$
Volendo puoi calcolare anche lo stimatore MAP (Maximum A Posteriori) massimizzando la posterior....
grazie credo di aver capito
ho però un altro dubbio su un esercizio simile:
Siano x1... xk campioni indipendenti estratti da una distribuzione di [highlight]Poisson[/highlight] di parametro $\lambda$ incognito. Impostare il problema della stima di $\lambda$ ..... scegliendo un'opportuna prior sapendo che in base ad informazioni precedenti si pensava che il parametro fosse compreso al 95% nell'intervallo [10 15].
il problema è sempre su come trovare la prior.
in questo caso la coniugata della Poisson è la $\Gamma$
esattamente come prima mi verrebbe da porre $f(\lambda) = \Gamma(a,b)$
e quindi di provare a risolvere: $\int_10^15f(\lambda) d\lambda =0.95$
anche qui però non conosco i parametri a,b della $\Gamma$, quindi non riuscirei a svolgere l'integrale
in questo caso come si fa?

ho però un altro dubbio su un esercizio simile:
Siano x1... xk campioni indipendenti estratti da una distribuzione di [highlight]Poisson[/highlight] di parametro $\lambda$ incognito. Impostare il problema della stima di $\lambda$ ..... scegliendo un'opportuna prior sapendo che in base ad informazioni precedenti si pensava che il parametro fosse compreso al 95% nell'intervallo [10 15].
il problema è sempre su come trovare la prior.
in questo caso la coniugata della Poisson è la $\Gamma$
esattamente come prima mi verrebbe da porre $f(\lambda) = \Gamma(a,b)$
e quindi di provare a risolvere: $\int_10^15f(\lambda) d\lambda =0.95$
anche qui però non conosco i parametri a,b della $\Gamma$, quindi non riuscirei a svolgere l'integrale
in questo caso come si fa?
la Gamma si standardizza in una $chi^2$ e per trovare i valori di $a$ e $b$ si usano le tavole
a me esce ad esempio
$pi(theta)="Gamma"(94;7.6)$
EDIT
in realtà dovresti risovere le seguenti disuguaglianze (supponendo ovviamente di impostare il problema con code equiprobabili, altrimenti ciccia perché ci sarebbero comunque infinite soluzioni)
$
{{: ( int_0^(10)b^a/(Gamma(a))theta^(a-1)e^(-b theta)d theta=0.025 ),( int_0^(15)b^a/(Gamma(a))theta^(a-1)e^(-b theta)d theta=0.975 ) :}$
che onestamente non mi sembrano di facile soluzione.....allora ho ragionato così:
Devo calcolare i parametri della gamma in modo che
$P(10
Allora mi accorgo che se $theta~"Gamma(a,b)$ allora $Y=2b theta~chi_((2a))^2$
Quindi cerco di calcolare i parametri della chi quadro tali per cui
$P(20b
sfogliando una qualunque tavola, cerco quindi fra le colonne delle probabilità 0.025 e 0.975 a cui corrispondono dei quantili tali per cui il maggiore sia una volta e mezza il minore....e mi accorgo che i gdl vanno oltre i 100; non avendo la tavola disponibile per gdl così elevati me la tabulo su Excel (ci vuole davvero poco) e così mi accorgo che il giochino funziona con 188 gdl, ovvero con un $a=188/2=94$ e con i due quantili che sono rispettivamente 152 e 228, ovvero $b=7.6$
Questa è la soluzione esatta e la probabilità cercata viene:
$P(10
Ovviamente il tutto si poteva risolvere con un'approssimazione gaussiana
Infatti, una volta visto che i gdl sono superiori ai 100 bastava risolvere il seguente sistema
${{: ( (30b-k)/sqrt(2k)=1.96 ),( (20b-k)/sqrt(2k)=-1.96) :}$
dove b è il nostro b e k sono i gdl, ovvero $2a$
Con questa approssimazione la probabilità richiesta viene 95.13% ma risolvi il tutto in 3 secondi e mezzo ottenendo
$a=192/2=96$ e $b=7.7$
...direi che ci siamo

PS: che cosa studi?
a me esce ad esempio
$pi(theta)="Gamma"(94;7.6)$
EDIT
in realtà dovresti risovere le seguenti disuguaglianze (supponendo ovviamente di impostare il problema con code equiprobabili, altrimenti ciccia perché ci sarebbero comunque infinite soluzioni)
$
{{: ( int_0^(10)b^a/(Gamma(a))theta^(a-1)e^(-b theta)d theta=0.025 ),( int_0^(15)b^a/(Gamma(a))theta^(a-1)e^(-b theta)d theta=0.975 ) :}$
che onestamente non mi sembrano di facile soluzione.....allora ho ragionato così:
Devo calcolare i parametri della gamma in modo che
$P(10
Allora mi accorgo che se $theta~"Gamma(a,b)$ allora $Y=2b theta~chi_((2a))^2$
Quindi cerco di calcolare i parametri della chi quadro tali per cui
$P(20b
sfogliando una qualunque tavola, cerco quindi fra le colonne delle probabilità 0.025 e 0.975 a cui corrispondono dei quantili tali per cui il maggiore sia una volta e mezza il minore....e mi accorgo che i gdl vanno oltre i 100; non avendo la tavola disponibile per gdl così elevati me la tabulo su Excel (ci vuole davvero poco) e così mi accorgo che il giochino funziona con 188 gdl, ovvero con un $a=188/2=94$ e con i due quantili che sono rispettivamente 152 e 228, ovvero $b=7.6$
Questa è la soluzione esatta e la probabilità cercata viene:
$P(10
Ovviamente il tutto si poteva risolvere con un'approssimazione gaussiana
Infatti, una volta visto che i gdl sono superiori ai 100 bastava risolvere il seguente sistema
${{: ( (30b-k)/sqrt(2k)=1.96 ),( (20b-k)/sqrt(2k)=-1.96) :}$
dove b è il nostro b e k sono i gdl, ovvero $2a$
Con questa approssimazione la probabilità richiesta viene 95.13% ma risolvi il tutto in 3 secondi e mezzo ottenendo
$a=192/2=96$ e $b=7.7$
...direi che ci siamo

PS: che cosa studi?
quindi, correggimi se sbaglio
dalle proprietà della $\Gamma$ so che: $\Gamma(a/2; 1/2) = \chi^2(a)$
visto che io avrei $\lambda ~\Gamma(a;b)$, per ottenere la forma della $\chi^2$ devo porre $y = 2b\lambda$
in questo modo avrei $y~\Gamma(a;1/2) = \Gamma(2a/2;1/2) = \chi^2(2a)$
ora potrei passare a verificare che $P(10<\lambda<15) = 0.95$ che diventerà $P(20b
quindi prendo le tavole della $\chi^2$, se uso 2 code guardo i valori per 0.975 e 0.025. scelgo i gradi di libertà che voglio (??), ad esempio 50 e ottengo $P(y<32.3) ~~ 2.5%$ e $P(y>71.42) ~~ 2.5%$
perciò visto che il parametro della $\chi^2$ sono i gradi di libertà ho che: $a=25$ e $b = 71.42/30 = 2.38$
[highlight]ho letto adesso la risposta, ma intanto stavo scrivendo questo quindi te lo invio comunque.[/highlight]
"cerco quindi fra le colonne a cui corrispondono le probabilità 0.025 e 0.975 dei quantili dove il maggiore sia una volta e mezza il minore" quello che mi mancava era questo.
Adesso ho capito tutto, grazie davvero!!
PS: studio ingegneria
dalle proprietà della $\Gamma$ so che: $\Gamma(a/2; 1/2) = \chi^2(a)$
visto che io avrei $\lambda ~\Gamma(a;b)$, per ottenere la forma della $\chi^2$ devo porre $y = 2b\lambda$
in questo modo avrei $y~\Gamma(a;1/2) = \Gamma(2a/2;1/2) = \chi^2(2a)$
ora potrei passare a verificare che $P(10<\lambda<15) = 0.95$ che diventerà $P(20b
quindi prendo le tavole della $\chi^2$, se uso 2 code guardo i valori per 0.975 e 0.025. scelgo i gradi di libertà che voglio (??), ad esempio 50 e ottengo $P(y<32.3) ~~ 2.5%$ e $P(y>71.42) ~~ 2.5%$
perciò visto che il parametro della $\chi^2$ sono i gradi di libertà ho che: $a=25$ e $b = 71.42/30 = 2.38$
[highlight]ho letto adesso la risposta, ma intanto stavo scrivendo questo quindi te lo invio comunque.[/highlight]
"cerco quindi fra le colonne a cui corrispondono le probabilità 0.025 e 0.975 dei quantili dove il maggiore sia una volta e mezza il minore" quello che mi mancava era questo.
Adesso ho capito tutto, grazie davvero!!

PS: studio ingegneria

"khnum":
[highlight]ho letto adesso la risposta, ma intanto stavo scrivendo questo quindi te lo invio comunque.[/highlight]
Hai fatto benissimo! Postare questi tentativi di soluzione è proprio nello spirito del forum, anzi è obbligatorio.
Sono io che in questo caso ho risposto troppo in fretta, senza aspettare il tuo intervento, perché sto andando in vacanza per il week end e non volevo lasciare il problema in sospeso....
Alla (settimana) prossima!

grazie mille!!!!

