Distorsione di uno stimatore con il metodo dei momenti
Ho \(\displaystyle (X_1,\ldots,X_n) \) Campione casuale estratto da una legge uniforme continua sull'intervallo \(\displaystyle (\alpha-\beta,\alpha+\beta) \) con \(\displaystyle \alpha\in\mathbb{R},\beta\in\mathbb{R}^+ \)
Verificare che \(\displaystyle E[X_1] \) dipende solo da \(\displaystyle \alpha \), mentre \(\displaystyle Var[X_1] \) dipende solo da \(\displaystyle \beta \) infatti \(\displaystyle E[X_1]=\alpha \) e \(\displaystyle Var[X_1]=\frac{\beta^2}{3} \) e qua è tutto ok.
Determinare con il metodo dei momenti gli stimatori \(\displaystyle \hat{T}_1, \hat{T}_2 \) di \(\displaystyle E[X_1](\alpha) \) e \(\displaystyle Var[X_1](\beta) \) rispetivamente
Che mi da \(\displaystyle \alpha=\bar{x}=\frac{1}{n}\sum x_i \) e \(\displaystyle \frac{\beta^2}{3}=S^2=\frac{1}{n-1}\sum(x_i-\bar{x})^2\Rightarrow \beta=\sqrt{\frac{3}{n-1}\sum(x_i-\bar{x})^2} \)
Ora devo calcolare la distorsione di \(\displaystyle \hat{T}_2 \) Devo perciò calcolare \(\displaystyle E[\hat{T}_2] \) che sarebbe per definizione \(\displaystyle \int_{\mathbb{R}^+}x\frac{\beta^2}{3}dx \) ma non ha molto senso perchè non converge come integrale
Guardando su wikipedia non capisco perchè definisce la varianza campionaria come \(\displaystyle \frac{1}{n}\sum(x_i-\bar{x})^2 \) quando il docente ce la ha sempre definita come \(\displaystyle \frac{1}{n-1}\sum(x_i-\bar{x})^2 \)
Verificare che \(\displaystyle E[X_1] \) dipende solo da \(\displaystyle \alpha \), mentre \(\displaystyle Var[X_1] \) dipende solo da \(\displaystyle \beta \) infatti \(\displaystyle E[X_1]=\alpha \) e \(\displaystyle Var[X_1]=\frac{\beta^2}{3} \) e qua è tutto ok.
Determinare con il metodo dei momenti gli stimatori \(\displaystyle \hat{T}_1, \hat{T}_2 \) di \(\displaystyle E[X_1](\alpha) \) e \(\displaystyle Var[X_1](\beta) \) rispetivamente
Che mi da \(\displaystyle \alpha=\bar{x}=\frac{1}{n}\sum x_i \) e \(\displaystyle \frac{\beta^2}{3}=S^2=\frac{1}{n-1}\sum(x_i-\bar{x})^2\Rightarrow \beta=\sqrt{\frac{3}{n-1}\sum(x_i-\bar{x})^2} \)
Ora devo calcolare la distorsione di \(\displaystyle \hat{T}_2 \) Devo perciò calcolare \(\displaystyle E[\hat{T}_2] \) che sarebbe per definizione \(\displaystyle \int_{\mathbb{R}^+}x\frac{\beta^2}{3}dx \) ma non ha molto senso perchè non converge come integrale
Guardando su wikipedia non capisco perchè definisce la varianza campionaria come \(\displaystyle \frac{1}{n}\sum(x_i-\bar{x})^2 \) quando il docente ce la ha sempre definita come \(\displaystyle \frac{1}{n-1}\sum(x_i-\bar{x})^2 \)
Risposte
Come primo punto parto dall'ultimo: varianze campionare ne esistono due: quella diviso $n$ e quella diviso $(n-1)$. La prima è uno stimatore distorto della varianza della popolazione (vedi anche nota 1, sotto)....la seconda è lo stimatore Corretto.
Dopo ti mostro il calcolo di tale media (richiesto dal problema) e te ne renderai conto.
Di solito quando si parla di Varianza Campionaria si usa lo stimatore corretto (come fa il tuo prof). In realtà non vi è molta differenza fra i due stimatori perché, come puoi notare, entrambi sono asintoticamente corretti....
$1/n ~~1/(n-1)$ al crescere di $n$
Veniamo al calcolo dei due stimatori;
NOTA BENE: indico con $mu,sigma^2$ media e varianza della popolazione[nota]che, ovviamente, per le proprietà del campionamento casuale, coincidono con media e varianza di ogni elemento del campione[/nota], rispettivamente.
$T_1=hat(mu)_(MM)$ e $T_2=hat(sigma)_(MM)^2$
Il primo è giusto il secondo no. Se leggi bene la definizione del metodo in oggetto vedi che non dice che la varianza della popolazione si stima con la varianza campionaria, questa è solo una conseguenza della definizione; il metodo afferma che I MOMENTI della popolazione si stimano con i MOMENTI campionari.
Quindi se devi stimare $mathbb{V}[X]=mathbb{E}[X^2]-(mathbb{E}[X])^2$ lo stimerai con[nota]su $T_1,T_2$ non ci va il cappello...[/nota]
$T_2=hat(mathbb{V})[X]_(MM)=1/nSigma_i X_i^2-(1/nSigma_i X_i)^2=...=1/nSigma_i(X_i-bar(X))^2$
Come vedi, applicando bene la definizione trovi "l'altra" formula della varianza campionaria e non quella a cui sei abituato (correttamente) ad usare
Calcolo della distorsione di $T_2$
Prima di tutto osserviamo che
Veniamo al calcolo:
$mathbb{E}[T_2]=mathbb{E}[1/nSigma_i(X_i-bar(X))^2]=1/nmathbb{E}[Sigma_i(X_i-mu)^2-n(bar(X)-mu)^2]=$
$=1/n{Sigma_i mathbb{E}[X_i-mu]^2-nmathbb{E}[bar(X)-mu]^2}=1/n{Sigma_i mathbb{V}[X]-nmathbb{V}[bar(X)]}$
$=1/n{Sigma_i sigma^2-n sigma^2/n}=sigma^2-sigma^2/n=mathbb{V}[X]+"Bias"[T_2,sigma^2]$
In definitiva, nel tuo esercizio, hai che $"Bias"[T_2,sigma^2]=-sigma^2/n=-beta^2/(3n)$
A questo punto hai un risultato generale, che si applica a qualunque densità e non solo a quella dell'esercizio in questione
Dopo ti mostro il calcolo di tale media (richiesto dal problema) e te ne renderai conto.
Di solito quando si parla di Varianza Campionaria si usa lo stimatore corretto (come fa il tuo prof). In realtà non vi è molta differenza fra i due stimatori perché, come puoi notare, entrambi sono asintoticamente corretti....
$1/n ~~1/(n-1)$ al crescere di $n$
Veniamo al calcolo dei due stimatori;
NOTA BENE: indico con $mu,sigma^2$ media e varianza della popolazione[nota]che, ovviamente, per le proprietà del campionamento casuale, coincidono con media e varianza di ogni elemento del campione[/nota], rispettivamente.
$T_1=hat(mu)_(MM)$ e $T_2=hat(sigma)_(MM)^2$
Il primo è giusto il secondo no. Se leggi bene la definizione del metodo in oggetto vedi che non dice che la varianza della popolazione si stima con la varianza campionaria, questa è solo una conseguenza della definizione; il metodo afferma che I MOMENTI della popolazione si stimano con i MOMENTI campionari.
Quindi se devi stimare $mathbb{V}[X]=mathbb{E}[X^2]-(mathbb{E}[X])^2$ lo stimerai con[nota]su $T_1,T_2$ non ci va il cappello...[/nota]
$T_2=hat(mathbb{V})[X]_(MM)=1/nSigma_i X_i^2-(1/nSigma_i X_i)^2=...=1/nSigma_i(X_i-bar(X))^2$
Come vedi, applicando bene la definizione trovi "l'altra" formula della varianza campionaria e non quella a cui sei abituato (correttamente) ad usare
Calcolo della distorsione di $T_2$
Prima di tutto osserviamo che
Veniamo al calcolo:
$mathbb{E}[T_2]=mathbb{E}[1/nSigma_i(X_i-bar(X))^2]=1/nmathbb{E}[Sigma_i(X_i-mu)^2-n(bar(X)-mu)^2]=$
$=1/n{Sigma_i mathbb{E}[X_i-mu]^2-nmathbb{E}[bar(X)-mu]^2}=1/n{Sigma_i mathbb{V}[X]-nmathbb{V}[bar(X)]}$
$=1/n{Sigma_i sigma^2-n sigma^2/n}=sigma^2-sigma^2/n=mathbb{V}[X]+"Bias"[T_2,sigma^2]$
In definitiva, nel tuo esercizio, hai che $"Bias"[T_2,sigma^2]=-sigma^2/n=-beta^2/(3n)$
A questo punto hai un risultato generale, che si applica a qualunque densità e non solo a quella dell'esercizio in questione

Quindi sostanzialmente \(\displaystyle T_2 \) non avendo una campione da cui calcolare la varianza campionaria, e stimare \(\displaystyle \beta\), ho che lo stimatore è il momento campionario centrato di ordine 2, e ne calcolo la media