Varianza campionaria
Si estrae un campione casuale di ampiezza n=25 da una popolazione distribuita normalmente con media 198 e varianza 100.
Qual è il valore della varianza campionaria che lascia alla sua sinistra il 5% dei valori della distribuzione?
io pensavo di fare nel seguente modo:
$P(((n-1)S^2)/sigma^2 >((n-1)K)/sigma^2)=0,05$
quindi
$P((chi^2)_(24 )>(chi^2)_(24,0.95))$
risolvo il $(chi^2)_(24,0.95))=13.85$
sapendo che
$(chi^2)_(24,0.95)=((n-1)K)/sigma^2)$
ricavo K e risolvo il limite richiesto per $S^2$
$K=57.71$
Qual è il valore della varianza campionaria che lascia alla sua sinistra il 5% dei valori della distribuzione?
io pensavo di fare nel seguente modo:
$P(((n-1)S^2)/sigma^2 >((n-1)K)/sigma^2)=0,05$
quindi
$P((chi^2)_(24 )>(chi^2)_(24,0.95))$
risolvo il $(chi^2)_(24,0.95))=13.85$
sapendo che
$(chi^2)_(24,0.95)=((n-1)K)/sigma^2)$
ricavo K e risolvo il limite richiesto per $S^2$
$K=57.71$
Risposte
[size=200]NO[/size]
....a parte il fatto che non è $K=57.71$ ma $S^2$
infatti, secondo i tuoi conti verrebbe
$P(S^2>k)=0.95$
$(24S^2)/100=13.85 rarr S^2=57.71$
ma in tutto ciò c'è un errore grossolano....ed anche abbastanza grave per uno studente di Statistica
la distribuzione da usare non è quella che hai indicato tu, bensì questa:
$(Sigma(X-mu)^2)/sigma^2$
infatti il testo di dice che il modello è normale di media $mu$ nota. La varianza campionaria ha dentro la media campionaria....proprio perché siamo in un caso in cui non si conosce la media vera della distribuzione....
...solo che bisogna scoprire che distribuzione sia.....
$(Sigma(X-mu)^2)/sigma^2=(Sigma(X-bar(X)+bar(X)-mu)^2)/sigma^2=$
$=(Sigma(X-bar(X))^2)/sigma^2+(n(bar(X)-mu)^2)/sigma^2$
il primo addendo è proprio $((n-1)S^2)/sigma^2~chi_((n-1))^2$
il secondo addendo invece è una distribuzione normale standard elevata al quadrato, ovvero una $chi_((1))^2$
Infatti possiamo vederlo come $[(bar(X)-mu)/(sigma/sqrt(n))]^2$
ora...dato che $bar(X)$ è uno stimatore sufficiente e completo per $mu$ mentre $S^2$ è uno stimatore ancillare per $mu$ dal teorema di Basu sappiamo anche che $bar(X)$ e $S^2$ sono indipendenti....quindi abbiamo una somma di due chi-quadro indipendenti....e per la proprietà riproduttiva delle chi-quadro la loro somma è ancora una chi-quadro con $n-1+1=n$ gradi di libertà.....quindi in poche parole devi usare le tavole della chi-quadro con 25 gradi di libertà e non 24
....a parte il fatto che non è $K=57.71$ ma $S^2$
infatti, secondo i tuoi conti verrebbe
$P(S^2>k)=0.95$
$(24S^2)/100=13.85 rarr S^2=57.71$
ma in tutto ciò c'è un errore grossolano....ed anche abbastanza grave per uno studente di Statistica
la distribuzione da usare non è quella che hai indicato tu, bensì questa:
$(Sigma(X-mu)^2)/sigma^2$
infatti il testo di dice che il modello è normale di media $mu$ nota. La varianza campionaria ha dentro la media campionaria....proprio perché siamo in un caso in cui non si conosce la media vera della distribuzione....
...solo che bisogna scoprire che distribuzione sia.....
$(Sigma(X-mu)^2)/sigma^2=(Sigma(X-bar(X)+bar(X)-mu)^2)/sigma^2=$
$=(Sigma(X-bar(X))^2)/sigma^2+(n(bar(X)-mu)^2)/sigma^2$
il primo addendo è proprio $((n-1)S^2)/sigma^2~chi_((n-1))^2$
il secondo addendo invece è una distribuzione normale standard elevata al quadrato, ovvero una $chi_((1))^2$
Infatti possiamo vederlo come $[(bar(X)-mu)/(sigma/sqrt(n))]^2$
ora...dato che $bar(X)$ è uno stimatore sufficiente e completo per $mu$ mentre $S^2$ è uno stimatore ancillare per $mu$ dal teorema di Basu sappiamo anche che $bar(X)$ e $S^2$ sono indipendenti....quindi abbiamo una somma di due chi-quadro indipendenti....e per la proprietà riproduttiva delle chi-quadro la loro somma è ancora una chi-quadro con $n-1+1=n$ gradi di libertà.....quindi in poche parole devi usare le tavole della chi-quadro con 25 gradi di libertà e non 24

Ti ringrazio della risposta,sicuramente ho sbagliato perchè il mio testo pur proponendo questo esercizio non si sia soffermato su molti argomenti da te descritti

sono argomenti importanti ma spesso tralasciati....apposta ti ho voluto mettere la dimostrazione di quanto affermato....
comunque la soluzione che ti ho mostrato ha anche una interpretazione logica molto consistente....se si conosce la media vera è evidente che dovremo pur avere qualche vantaggio rispetto al caso in cui non la conosciamo...ed infatti il vantaggio sta nel fatto di avere un grado di libertà in più, ovvero un grado in più di libertà nel decidere
Formalmente possiamo evitare di avere
$sum_(i=1)^(25)(X_(i)-bar(X))=0$
che è una relazione lineare fra le variabili e causa della sottrazione di un grado di libertà
Ricorda infatti che i gradi di libertà sono il numero delle variabili meno le relazioni lineari fra le variabili.
Conoscendo la media vera possiamo sostituire la relazione di cui sopra con
$sum_(i=1)^(25)(X_(i)-mu) != 0$
ora riesci a leggere? ho cambiato tastiera....sono all'estero e i caratteri sono diversi da quelli europei
comunque la soluzione che ti ho mostrato ha anche una interpretazione logica molto consistente....se si conosce la media vera è evidente che dovremo pur avere qualche vantaggio rispetto al caso in cui non la conosciamo...ed infatti il vantaggio sta nel fatto di avere un grado di libertà in più, ovvero un grado in più di libertà nel decidere
Formalmente possiamo evitare di avere
$sum_(i=1)^(25)(X_(i)-bar(X))=0$
che è una relazione lineare fra le variabili e causa della sottrazione di un grado di libertà
Ricorda infatti che i gradi di libertà sono il numero delle variabili meno le relazioni lineari fra le variabili.
Conoscendo la media vera possiamo sostituire la relazione di cui sopra con
$sum_(i=1)^(25)(X_(i)-mu) != 0$
ora riesci a leggere? ho cambiato tastiera....sono all'estero e i caratteri sono diversi da quelli europei
Ora leggo benissimo. In pratica alla fine della storia devo giustamente considerare n=25 g.l quindi pochè cerco la varianza campionaria a sinistra
$P(S^2
$P((chi^2)_(25)<(chi^2)_(25,0.95))=0.05$
$P(S^2
esattamente.
solo che ora la varianza campionaria non esiste più...
devi calcolare
$P((Sigma(X-mu)^2)/100
leggendo il valore di k sulla chi-quadro con 25 gdl....e quindi
$Sigma(X-mu)^2=100\cdot14.61=1461$
e quindi ottenere che $(Sigma(X-mu)^2)/25=58.45$
solo che ora la varianza campionaria non esiste più...
devi calcolare
$P((Sigma(X-mu)^2)/100
leggendo il valore di k sulla chi-quadro con 25 gdl....e quindi
$Sigma(X-mu)^2=100\cdot14.61=1461$
e quindi ottenere che $(Sigma(X-mu)^2)/25=58.45$
Scrivo qui per evitare di aprire un'altra discussione simile a questa.
Se ho $X ~N(mu, 2500^2) $ed $n=16$ osservazioni
come calcolo la possibilita che la deviazione standard campionaria superi 3000?
Se ho $X ~N(mu, 2500^2) $ed $n=16$ osservazioni
come calcolo la possibilita che la deviazione standard campionaria superi 3000?
qui la media della popolazione non è nota e quindi fai esattamente come volevi fare nell'esercizio precedente, utilizzando la distribuzione nota:
$((n-1)S^2)/sigma^2~chi_((n-1))^2$
$P(S^2>3000^2)=P{chi_((15))^2>(15\cdot3000^2)/(2500^2)}=P{chi_((15))^2>21.6}=0.1187$
la distribuzione della deviazione standard campionaria non è una distribuzione nota....però potrebbe essere interessante, come esercizio, calcolare media e deviazione standard della deviazione standard campionaria in un modello normale.....forse però è va un po' oltre il tuo programma....
$((n-1)S^2)/sigma^2~chi_((n-1))^2$
$P(S^2>3000^2)=P{chi_((15))^2>(15\cdot3000^2)/(2500^2)}=P{chi_((15))^2>21.6}=0.1187$
la distribuzione della deviazione standard campionaria non è una distribuzione nota....però potrebbe essere interessante, come esercizio, calcolare media e deviazione standard della deviazione standard campionaria in un modello normale.....forse però è va un po' oltre il tuo programma....
Un esercizio simile propone questo se io ho una$ X~N(420;100^2)$ con $n=25$
si vuole trovare "il valore della dev. standard campionaria che è superato con probabilità $0.05$"
Il mio tentativo è stato
$P(S^2>K) =0.05$
$P( (chi^2)_25>(chi^2)_(25,0.05)$
$P (25*S^2/100^2>37.65)$
quindi ho $S^2=376500/25=15060$da cui $s=sqrt(15060)$
si vuole trovare "il valore della dev. standard campionaria che è superato con probabilità $0.05$"
Il mio tentativo è stato
$P(S^2>K) =0.05$
$P( (chi^2)_25>(chi^2)_(25,0.05)$
$P (25*S^2/100^2>37.65)$
quindi ho $S^2=376500/25=15060$da cui $s=sqrt(15060)$
domanda:
ma se la media "Vera" è nota, e vale 420 perché mai dovrei usare questa statistica
$S=sqrt(1/(n-1)sum_(i=1)^(n)(x_(i)-bar(x))^2)$
dove al posto della media sostituisco la sua stima $bar(x)$?
Oltretutto se uso $S$ la distribuzione nota è $((n-1)S^2)/sigma^2~chi_((n-1))^2$
PS: il valore numerico del risultato trovato è corretto
ma se la media "Vera" è nota, e vale 420 perché mai dovrei usare questa statistica
$S=sqrt(1/(n-1)sum_(i=1)^(n)(x_(i)-bar(x))^2)$
dove al posto della media sostituisco la sua stima $bar(x)$?
Oltretutto se uso $S$ la distribuzione nota è $((n-1)S^2)/sigma^2~chi_((n-1))^2$
PS: il valore numerico del risultato trovato è corretto
In pratica dovrei considerare $n-1$ g.l?
Non avevamo detto che se conosco la media posso considerare $n$ g.l?
Non avevamo detto che se conosco la media posso considerare $n$ g.l?
Ovviamente devi usare n gradi di libertà.....solo che non c'è più la varianza campionaria ma un altro indicatore, che considera gli scarti campionari dalla media vera......
$hat(S)^2=1/n sum_(i)(X_(i)-mu)^2$
ma non vi spiegano queste cose a scuola???????
ti ho anche dimostrato come questa distribuzione si riconduca ad una chi-quadro con n gradi di libertà e non (n-1)...basta che guardi i miei post precedenti
$hat(S)^2=1/n sum_(i)(X_(i)-mu)^2$
ma non vi spiegano queste cose a scuola???????
ti ho anche dimostrato come questa distribuzione si riconduca ad una chi-quadro con n gradi di libertà e non (n-1)...basta che guardi i miei post precedenti
Purtroppo no
saiindicarmi il nome di questa variabile e un po' di materiale di studio? (chiedo scusa per l'off-topic) Io studio sul Newbold-Carlson-Thorne.
Poi è lo stesso libro a chiedermi di calcolare la deviazione campionaria
p.s
se non mi sbagli mi hai gia accennato qualcosa nel 2 e 3 post di questa discussione.

Poi è lo stesso libro a chiedermi di calcolare la deviazione campionaria
p.s
se non mi sbagli mi hai gia accennato qualcosa nel 2 e 3 post di questa discussione.
