Varianza campionaria

Comeover
Si estrae un campione casuale di ampiezza n=25 da una popolazione distribuita normalmente con media 198 e varianza 100.
Qual è il valore della varianza campionaria che lascia alla sua sinistra il 5% dei valori della distribuzione?
io pensavo di fare nel seguente modo:
$P(((n-1)S^2)/sigma^2 >((n-1)K)/sigma^2)=0,05$
quindi
$P((chi^2)_(24 )>(chi^2)_(24,0.95))$
risolvo il $(chi^2)_(24,0.95))=13.85$
sapendo che
$(chi^2)_(24,0.95)=((n-1)K)/sigma^2)$
ricavo K e risolvo il limite richiesto per $S^2$
$K=57.71$

Risposte
Lo_zio_Tom
[size=200]NO[/size]

....a parte il fatto che non è $K=57.71$ ma $S^2$


infatti, secondo i tuoi conti verrebbe

$P(S^2>k)=0.95$

$(24S^2)/100=13.85 rarr S^2=57.71$

ma in tutto ciò c'è un errore grossolano
....ed anche abbastanza grave per uno studente di Statistica

la distribuzione da usare non è quella che hai indicato tu, bensì questa:

$(Sigma(X-mu)^2)/sigma^2$

infatti il testo di dice che il modello è normale di media $mu$ nota. La varianza campionaria ha dentro la media campionaria....proprio perché siamo in un caso in cui non si conosce la media vera della distribuzione....

...solo che bisogna scoprire che distribuzione sia.....

$(Sigma(X-mu)^2)/sigma^2=(Sigma(X-bar(X)+bar(X)-mu)^2)/sigma^2=$

$=(Sigma(X-bar(X))^2)/sigma^2+(n(bar(X)-mu)^2)/sigma^2$

il primo addendo è proprio $((n-1)S^2)/sigma^2~chi_((n-1))^2$

il secondo addendo invece è una distribuzione normale standard elevata al quadrato, ovvero una $chi_((1))^2$

Infatti possiamo vederlo come $[(bar(X)-mu)/(sigma/sqrt(n))]^2$

ora...dato che $bar(X)$ è uno stimatore sufficiente e completo per $mu$ mentre $S^2$ è uno stimatore ancillare per $mu$ dal teorema di Basu sappiamo anche che $bar(X)$ e $S^2$ sono indipendenti....quindi abbiamo una somma di due chi-quadro indipendenti....e per la proprietà riproduttiva delle chi-quadro la loro somma è ancora una chi-quadro con $n-1+1=n$ gradi di libertà.....quindi in poche parole devi usare le tavole della chi-quadro con 25 gradi di libertà e non 24

:-D

Comeover
Ti ringrazio della risposta,sicuramente ho sbagliato perchè il mio testo pur proponendo questo esercizio non si sia soffermato su molti argomenti da te descritti :)

Lo_zio_Tom
sono argomenti importanti ma spesso tralasciati....apposta ti ho voluto mettere la dimostrazione di quanto affermato....

comunque la soluzione che ti ho mostrato ha anche una interpretazione logica molto consistente....se si conosce la media vera è evidente che dovremo pur avere qualche vantaggio rispetto al caso in cui non la conosciamo...ed infatti il vantaggio sta nel fatto di avere un grado di libertà in più, ovvero un grado in più di libertà nel decidere

Formalmente possiamo evitare di avere

$sum_(i=1)^(25)(X_(i)-bar(X))=0$

che è una relazione lineare fra le variabili e causa della sottrazione di un grado di libertà

Ricorda infatti che i gradi di libertà sono il numero delle variabili meno le relazioni lineari fra le variabili.

Conoscendo la media vera possiamo sostituire la relazione di cui sopra con

$sum_(i=1)^(25)(X_(i)-mu) != 0$

ora riesci a leggere? ho cambiato tastiera....sono all'estero e i caratteri sono diversi da quelli europei

Comeover
Ora leggo benissimo. In pratica alla fine della storia devo giustamente considerare n=25 g.l quindi pochè cerco la varianza campionaria a sinistra
$P(S^2 $P((chi^2)_(25)<(chi^2)_(25,0.95))=0.05$

Lo_zio_Tom
esattamente.

solo che ora la varianza campionaria non esiste più...

devi calcolare

$P((Sigma(X-mu)^2)/100
leggendo il valore di k sulla chi-quadro con 25 gdl....e quindi

$Sigma(X-mu)^2=100\cdot14.61=1461$

e quindi ottenere che $(Sigma(X-mu)^2)/25=58.45$

Comeover
Scrivo qui per evitare di aprire un'altra discussione simile a questa.
Se ho $X ~N(mu, 2500^2) $ed $n=16$ osservazioni
come calcolo la possibilita che la deviazione standard campionaria superi 3000?

Lo_zio_Tom
qui la media della popolazione non è nota e quindi fai esattamente come volevi fare nell'esercizio precedente, utilizzando la distribuzione nota:

$((n-1)S^2)/sigma^2~chi_((n-1))^2$

$P(S^2>3000^2)=P{chi_((15))^2>(15\cdot3000^2)/(2500^2)}=P{chi_((15))^2>21.6}=0.1187$


la distribuzione della deviazione standard campionaria non è una distribuzione nota....però potrebbe essere interessante, come esercizio, calcolare media e deviazione standard della deviazione standard campionaria in un modello normale.....forse però è va un po' oltre il tuo programma....

Comeover
Un esercizio simile propone questo se io ho una$ X~N(420;100^2)$ con $n=25$
si vuole trovare "il valore della dev. standard campionaria che è superato con probabilità $0.05$"

Il mio tentativo è stato
$P(S^2>K) =0.05$
$P( (chi^2)_25>(chi^2)_(25,0.05)$
$P (25*S^2/100^2>37.65)$
quindi ho $S^2=376500/25=15060$da cui $s=sqrt(15060)$

Lo_zio_Tom
domanda:

ma se la media "Vera" è nota, e vale 420 perché mai dovrei usare questa statistica

$S=sqrt(1/(n-1)sum_(i=1)^(n)(x_(i)-bar(x))^2)$

dove al posto della media sostituisco la sua stima $bar(x)$?

Oltretutto se uso $S$ la distribuzione nota è $((n-1)S^2)/sigma^2~chi_((n-1))^2$


PS: il valore numerico del risultato trovato è corretto

Comeover
In pratica dovrei considerare $n-1$ g.l?
Non avevamo detto che se conosco la media posso considerare $n$ g.l?

Lo_zio_Tom
Ovviamente devi usare n gradi di libertà.....solo che non c'è più la varianza campionaria ma un altro indicatore, che considera gli scarti campionari dalla media vera......


$hat(S)^2=1/n sum_(i)(X_(i)-mu)^2$


ma non vi spiegano queste cose a scuola???????

ti ho anche dimostrato come questa distribuzione si riconduca ad una chi-quadro con n gradi di libertà e non (n-1)...basta che guardi i miei post precedenti

Comeover
Purtroppo no :( saiindicarmi il nome di questa variabile e un po' di materiale di studio? (chiedo scusa per l'off-topic) Io studio sul Newbold-Carlson-Thorne.
Poi è lo stesso libro a chiedermi di calcolare la deviazione campionaria

p.s
se non mi sbagli mi hai gia accennato qualcosa nel 2 e 3 post di questa discussione.:)

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.