Esercizio inferenza (piccolo dubbio)
Ciao a tutti,
ho un dubbio su un punto di un esercizio che ho svolto quasi completamente.
Di seguito testo e soluzioni.
In uno studio di astronomia, i ricercatori sono interessati a valutare la distanza $mu$ in anni luce di una certa stella. A tal fine, vengono effettuate $n$ misurazioni $y_1,...,y_n$ della distanza con strumenti di misura aventi diversa precisione. Si assuma che i dati siano realizzazioni di variabili casuali indipendenti $Y_I$ $ tilde $ $N(mu, (sigma^2)_i)$ $i= 1,...,n$ e varienze $(sigma^2)_i$ note e positive
a) Si specifichi il modello statistico per i dati a disposizione:
$p_Y(y;mu) = (2pi) ^-(n/2) prod_{i=1}^n 1/sqrt(sigma^2)exp(-1/(2(sigma^2)_i) * (y_i - mu)^2)$
b) Si ottengano le funzioni di verosimiglianza e log_verosimiglianza per mu.
$k = (2pi) ^-(n/2) prod_{i=1}^n 1/sqrt(sigma^2)$ --> costante moltiplicativa
$L(mu) = k * exp(-1/2 sum_{i=1}^n (1/ (sigma^2)_i) * (y_i - mu)^2) $
$l(mu) =- 1/2sum_{i=1}^n (1/ (sigma^2)_i) * (y_i - mu)^2 = $
$= -1/2 sum_{i=1}^n ((y_i)^2+ mu^2 -2y_imu)/(sigma_i)^2 = $
$ = -1/2 sum_{i=1}^n ((y_i)^2/ (sigma^2)_i) + 1/2mu^2/(sigma_i) -1/2 sum_{i=1}^n (2y_imu)/(sigma_i)$
$ = -c -mu^2sum_{i=1}^n 1/ (sigma^2)_i + mu sum_{i=1}^n (y_i)/ (sigma^2)_i$
c) Si calcoli la funzione di punteggio, l'informazione osservata e attesa:
$l_*(mu) = sum_{i=1}^n y_i/(sigma_i)^2 - mu sum_{i=1}^n 1/ (sigma_i)^2$
$j(mu) = sum_{i=1}^n 1/ (sigma_i)^2$
$i(mu) = j(mu)$
d) si ottengo lo stimatore di massima verosimiglianza
$ hat(mu) = (sum_{i=1}^n y_i/ (sigma_i)^2) / (sum_{i=1}^n 1/ (sigma_i)^2)$
Arriviamo al mio dubbio...
e) si ottenga la distribuzione esatta dello stimatore di massima verosimiglianza
Soluzione: $hat(mu)$ è una combinazione lineare, con pesi $(1/(sigma_i)^2)/(sum_{i=1}^n 1/ (sigma_i)^2)$ delle v.c. $Y_i$. Si ha quindi $hat(mu)$ $tilde$ $N(mu, 1/ (sigma_i)^2)$...
Sinceramente non ho capito molto. Come si arriva a questa soluzione?
ho un dubbio su un punto di un esercizio che ho svolto quasi completamente.
Di seguito testo e soluzioni.
In uno studio di astronomia, i ricercatori sono interessati a valutare la distanza $mu$ in anni luce di una certa stella. A tal fine, vengono effettuate $n$ misurazioni $y_1,...,y_n$ della distanza con strumenti di misura aventi diversa precisione. Si assuma che i dati siano realizzazioni di variabili casuali indipendenti $Y_I$ $ tilde $ $N(mu, (sigma^2)_i)$ $i= 1,...,n$ e varienze $(sigma^2)_i$ note e positive
a) Si specifichi il modello statistico per i dati a disposizione:
$p_Y(y;mu) = (2pi) ^-(n/2) prod_{i=1}^n 1/sqrt(sigma^2)exp(-1/(2(sigma^2)_i) * (y_i - mu)^2)$
b) Si ottengano le funzioni di verosimiglianza e log_verosimiglianza per mu.
$k = (2pi) ^-(n/2) prod_{i=1}^n 1/sqrt(sigma^2)$ --> costante moltiplicativa
$L(mu) = k * exp(-1/2 sum_{i=1}^n (1/ (sigma^2)_i) * (y_i - mu)^2) $
$l(mu) =- 1/2sum_{i=1}^n (1/ (sigma^2)_i) * (y_i - mu)^2 = $
$= -1/2 sum_{i=1}^n ((y_i)^2+ mu^2 -2y_imu)/(sigma_i)^2 = $
$ = -1/2 sum_{i=1}^n ((y_i)^2/ (sigma^2)_i) + 1/2mu^2/(sigma_i) -1/2 sum_{i=1}^n (2y_imu)/(sigma_i)$
$ = -c -mu^2sum_{i=1}^n 1/ (sigma^2)_i + mu sum_{i=1}^n (y_i)/ (sigma^2)_i$
c) Si calcoli la funzione di punteggio, l'informazione osservata e attesa:
$l_*(mu) = sum_{i=1}^n y_i/(sigma_i)^2 - mu sum_{i=1}^n 1/ (sigma_i)^2$
$j(mu) = sum_{i=1}^n 1/ (sigma_i)^2$
$i(mu) = j(mu)$
d) si ottengo lo stimatore di massima verosimiglianza
$ hat(mu) = (sum_{i=1}^n y_i/ (sigma_i)^2) / (sum_{i=1}^n 1/ (sigma_i)^2)$
Arriviamo al mio dubbio...
e) si ottenga la distribuzione esatta dello stimatore di massima verosimiglianza
Soluzione: $hat(mu)$ è una combinazione lineare, con pesi $(1/(sigma_i)^2)/(sum_{i=1}^n 1/ (sigma_i)^2)$ delle v.c. $Y_i$. Si ha quindi $hat(mu)$ $tilde$ $N(mu, 1/ (sigma_i)^2)$...

Sinceramente non ho capito molto. Come si arriva a questa soluzione?
Risposte
Non mi torna.
a me viene
$ N (mu; 1/(sum_(i) 1/sigma_(i)^2)) $
a me viene
$ N (mu; 1/(sum_(i) 1/sigma_(i)^2)) $
Sì hai ragione...era sbagliata la soluzione.
Mi spieghi come ci sei arrivato?
Mi spieghi come ci sei arrivato?
Se le $ X_(i)~N (mu; sigma^2) $
Allora
$ sum_(i) a_(i) X_(i)~N (mu sum_(i) a_(i); sigma^2 sum_(i) a_(i)^2) $
Allora
$ sum_(i) a_(i) X_(i)~N (mu sum_(i) a_(i); sigma^2 sum_(i) a_(i)^2) $
Ok...ci ragiono un attimo e ti dico se ho capito
Allora:
$(sum y_i * 1/ sigma^2) /( sum 1/ sigma^2) $ $ tilde $ $ N( (mu * 1/sigma^2)/(sum 1/sigma^2), (sigma^2 * 1/sigma^2) / (sum 1/sigma^2))$
$(sum y_i) $ $ tilde $ $ N( (mu * 1/sigma^2)/(sum 1/sigma^2), (1) / (sum 1/sigma^2))$
Ma il primo parametro si semplifica nel secondo passaggio?
$(sum y_i * 1/ sigma^2) /( sum 1/ sigma^2) $ $ tilde $ $ N( (mu * 1/sigma^2)/(sum 1/sigma^2), (sigma^2 * 1/sigma^2) / (sum 1/sigma^2))$
$(sum y_i) $ $ tilde $ $ N( (mu * 1/sigma^2)/(sum 1/sigma^2), (1) / (sum 1/sigma^2))$
Ma il primo parametro si semplifica nel secondo passaggio?
Si si semplifica.
Hai dimenticato una somma al numeratore
$(sum_(i) a_(i) mu)/(sum_(i) a_(i))=mu $
Avendo posto $ a_(i)=1/sigma_(i)^2$
Per la varianza invece avrai
$(sum_(i) a_(i)^2/a_(i))/(suma_(i))^2=1/(suma_(i)) $
Spero sia chiaro perché sto facendo i conti a mente e senza carta e penna
Ovviamente do per scontato che lo stimatore di massima verosimiglianza sia giusto...
però per rispondere in maniera esaustiva all'esercizio dovresti anche dimostrare che la distribuzione dello stimatore è normale, e non solo che parametri abbia...
Per questo basta fare così:
siano $X_(1)....X_(n)$ variabili casuali indipendenti $X_(i)~ N(mu;sigma_(i)^2)$
allora
$M_(suma_(i)X_(i))=Pi_(i)M_(X_(i))(a_(i)t)=Exp{mu t sum_(i)a_(i)+1/2(sum_(i)a_(i)^2sigma_(i)^2)t^2}$
che è la fgm di una normale di media $(mu sum_(i)a_(i))$ e varianza $sum_(i)a_(i)^2sigma_(i)^2$
Hai dimenticato una somma al numeratore
$(sum_(i) a_(i) mu)/(sum_(i) a_(i))=mu $
Avendo posto $ a_(i)=1/sigma_(i)^2$
Per la varianza invece avrai
$(sum_(i) a_(i)^2/a_(i))/(suma_(i))^2=1/(suma_(i)) $
Spero sia chiaro perché sto facendo i conti a mente e senza carta e penna
Ovviamente do per scontato che lo stimatore di massima verosimiglianza sia giusto...
però per rispondere in maniera esaustiva all'esercizio dovresti anche dimostrare che la distribuzione dello stimatore è normale, e non solo che parametri abbia...
Per questo basta fare così:
siano $X_(1)....X_(n)$ variabili casuali indipendenti $X_(i)~ N(mu;sigma_(i)^2)$
allora
$M_(suma_(i)X_(i))=Pi_(i)M_(X_(i))(a_(i)t)=Exp{mu t sum_(i)a_(i)+1/2(sum_(i)a_(i)^2sigma_(i)^2)t^2}$
che è la fgm di una normale di media $(mu sum_(i)a_(i))$ e varianza $sum_(i)a_(i)^2sigma_(i)^2$
Sì chiarissimo...grazie mille...sei veramente bravo..
Ti ringrazio
Ti ringrazio
