Test del $chi^2$, Fischer e variabili aleatorie.
Ciao a tutti!
Sono alle prese da un po' con la statistica e vorrei poter chiarire alcuni concetti tipo, il test del $chi^2$ si basa sulla variabile aleatoria $chi^2$, ma qual è la sua distribuzione? Dovrebbe essere questa:
$chi^2 = [(n-1)*S^2]/(sigma^2)$
con $v-1$ gradi di libertà. Ora $S^2$ è la varianza capionaria e $sigma^2$ la varianza. Se non ho sbagliato. Ma quell' $(n-1)$ cosa rappresenta?
Mentre se non ho capito male la Distribuzione di Fisher-Snedecor è la distribuzione del rapporto di due chi-quadro indipendenti con gradi di libertà num (n) e den (d), ovvero:
$F = (chi_n)^2 / (chi_d)^2$
anche se dovrei capire cosa rappresentano quei gradi di libertà e quindi (v-1), num e dem.
Grazie!
Sono alle prese da un po' con la statistica e vorrei poter chiarire alcuni concetti tipo, il test del $chi^2$ si basa sulla variabile aleatoria $chi^2$, ma qual è la sua distribuzione? Dovrebbe essere questa:
$chi^2 = [(n-1)*S^2]/(sigma^2)$
con $v-1$ gradi di libertà. Ora $S^2$ è la varianza capionaria e $sigma^2$ la varianza. Se non ho sbagliato. Ma quell' $(n-1)$ cosa rappresenta?
Mentre se non ho capito male la Distribuzione di Fisher-Snedecor è la distribuzione del rapporto di due chi-quadro indipendenti con gradi di libertà num (n) e den (d), ovvero:
$F = (chi_n)^2 / (chi_d)^2$
anche se dovrei capire cosa rappresentano quei gradi di libertà e quindi (v-1), num e dem.
Grazie!
Risposte
ma qual è la sua distribuzione?
Ma intendi la distribuzione del test? Quella è semplicemente un $chi^2$ con $nu-1$ gradi di libertà.
L'uguaglianza che hai scritto dopo non c'entra col test $chi^2$.
$((n-1)S^2)/(sigma^2)$ è la distribuzione della varianza campionaria (che è appunto un $chi^2$)
la Distribuzione di Fisher-Snedecor è la distribuzione del rapporto di due chi-quadro indipendenti
Non esattamente. E' il rapporto di due $chi^2$ indipendenti ognuno diviso per i suoi gradi di libertà, cioé:
$(X/n)/(Y/m)\simF_{(n,m)}$ dove $X\simchi^2_n$ e $Y\simchi^2_m$
"Arado90":ma qual è la sua distribuzione?
Ma intendi la distribuzione del test? Quella è semplicemente un $chi^2$ con $nu-1$ gradi di libertà.
L'uguaglianza che hai scritto dopo non c'entra col test $chi^2$.
$((n-1)S^2)/(sigma^2)$ è la distribuzione della varianza campionaria (che è appunto un $chi^2$)
la Distribuzione di Fisher-Snedecor è la distribuzione del rapporto di due chi-quadro indipendenti
Non esattamente. E' il rapporto di due $chi^2$ indipendenti ognuno diviso per i suoi gradi di libertà, cioé:
$(X/n)/(Y/m)\simF_{(n,m)}$ dove $X\simchi^2_n$ e $Y\simchi^2_m$
Io vorrei sapere solo come è definita una variabile aleatoria $chi^2$ a prescindere dal test, come ho fatto e mi hai corretto con la variabile aleatoria di Fisher. Però tutti partono direttamente con il test del $chi^2$ ma io vorrei anche capire che forma ha questa variabile aleatoria!
Ah! 
Allora in questo caso chiamiamo $Z$ una v.c. distribuita come una Normale standard $Z\simN(0,1)$
Allora $Z^2\simchi^2_1$
Di conseguenza $\sum_{i=1}^n Z_i^2 \sim chi^2_n$

Allora in questo caso chiamiamo $Z$ una v.c. distribuita come una Normale standard $Z\simN(0,1)$
Allora $Z^2\simchi^2_1$
Di conseguenza $\sum_{i=1}^n Z_i^2 \sim chi^2_n$
"Arado90":
Ah!
Allora in questo caso chiamiamo $Z$ una v.c. distribuita come una Normale standard $Z\simN(0,1)$
Allora $Z^2\simchi^2_1$
Di conseguenza $\sum_{i=1}^n Z_i^2 \sim chi^2_n$
Ma quindi la funzione $f(x)$ di densità di probabilità di una variabile aleatoria chi quadro è la sommatoria di $n$ variabili aleatorie gaussiane? E la sua funzione di distribuzione cumulativa?
Ai fini del corso di statistica, credo non ti interessi conoscere le espressioni esplicite della distribuzione e della densità di probabilità del [tex]\chi^2[/tex], In ogni caso si possono comunque calcolare dall'integrale (lo scrivo solo per curiosità, visto che per motivi vari ho il [tex]\LaTeX[/tex] già pronto)
[tex]\displaystyle \mathsf{P}(\chi^2 \leqslant x)= \int_{\xi_1^2+...+\xi_N^2 \leqslant x} d\xi_1...d\xi_N \frac{1}{(2\pi)^{N/2}} e^{-(\xi_1^2+...\xi_N^2)/2} = \frac {1}{2^{N/2} \Gamma(\frac{N}{2})} \int_0^x s^{N/2-1} e^{-s/2}ds[/tex]
e la relativa densità, che ottieni derivando, [tex]\displaystyle p(x)=\frac{ x^{N/2-1} e^{-x/2}} {2^{N/2} \Gamma(\frac{N}{2})}[/tex].
Ai fini della stima, ti interessa invece sapere che:
se il parametro [tex]\mu[/tex] della distribuzione è noto, allora, dalla definizione, [tex]\displaystyle \sum_{i=1}^{N}\frac{(x_i-\mu)^2}{\sigma^2} \sim \chi^2_N[/tex]
se invece non lo è, si usa la media campionaria [tex]\bar{x}[/tex], e si dimostra, in un modo un po' più articolato, ma che riguarda più la teoria della probabilità che la statistica, che [tex]\displaystyle \sum_{i=1}^{N}\frac{(x_i-\bar{x})^2}{\sigma^2} \sim \chi^2_{N-1}[/tex]
[tex]\displaystyle \mathsf{P}(\chi^2 \leqslant x)= \int_{\xi_1^2+...+\xi_N^2 \leqslant x} d\xi_1...d\xi_N \frac{1}{(2\pi)^{N/2}} e^{-(\xi_1^2+...\xi_N^2)/2} = \frac {1}{2^{N/2} \Gamma(\frac{N}{2})} \int_0^x s^{N/2-1} e^{-s/2}ds[/tex]
e la relativa densità, che ottieni derivando, [tex]\displaystyle p(x)=\frac{ x^{N/2-1} e^{-x/2}} {2^{N/2} \Gamma(\frac{N}{2})}[/tex].
Ai fini della stima, ti interessa invece sapere che:
se il parametro [tex]\mu[/tex] della distribuzione è noto, allora, dalla definizione, [tex]\displaystyle \sum_{i=1}^{N}\frac{(x_i-\mu)^2}{\sigma^2} \sim \chi^2_N[/tex]
se invece non lo è, si usa la media campionaria [tex]\bar{x}[/tex], e si dimostra, in un modo un po' più articolato, ma che riguarda più la teoria della probabilità che la statistica, che [tex]\displaystyle \sum_{i=1}^{N}\frac{(x_i-\bar{x})^2}{\sigma^2} \sim \chi^2_{N-1}[/tex]
Per la precisione un $chi^2$ con $n$ gradi di libertà è generato dalla somma di $n$ v.c. Normali standard al quadrato indipendenti (l'indipendenza prima non te l'avevo detta).
Questo non c'entra nulla con la densità, che comunque ti è stata giustamente indicata poco sopra. Ma dubito che ti sia d'utilità
Lo stesso vale per la F, quello indicato all'inizio è il modo in cui ha origine, non è la sua densità.
Questo non c'entra nulla con la densità, che comunque ti è stata giustamente indicata poco sopra. Ma dubito che ti sia d'utilità

Lo stesso vale per la F, quello indicato all'inizio è il modo in cui ha origine, non è la sua densità.
"Arado90":
Per la precisione un $chi^2$ con $n$ gradi di libertà è generato dalla somma di $n$ v.c. Normali standard al quadrato indipendenti (l'indipendenza prima non te l'avevo detta).
Questo non c'entra nulla con la densità, che comunque ti è stata giustamente indicata poco sopra. Ma dubito che ti sia d'utilità
Lo stesso vale per la F, quello indicato all'inizio è il modo in cui ha origine, non è la sua densità.
Allora mi sa che la domanda che dovevo porre fin dall'inzio è, cosa rappresenta quella formula F e quella chi-quadro?
Pensavo fossero delle distribuzioni...
No, diciamo che è il modo da cui hanno origine le variabili $chi^2$ e $F$, usando altre variabili.
Cioè, puoi dimostrare che la somma dei quadrati di $n$ normali standard indipendenti è distribuita come un $chi^2$ e quindi ha densità $1/(2^(n/2)Gamma(n/2))*(x^(n/2-1)e^(-x/2))$
Cioè, puoi dimostrare che la somma dei quadrati di $n$ normali standard indipendenti è distribuita come un $chi^2$ e quindi ha densità $1/(2^(n/2)Gamma(n/2))*(x^(n/2-1)e^(-x/2))$
Devo porre la domanda ancora in maniera diversa.
Sto studiando l'esame di misure elettroniche (ed è una confusione totale) e al momento sono alle prese con la parte di statistica. Ora ancor prima del test del chi quadro e del test di Fischer, io vorrei capire le seguenti cose:
1) Cosa mi interessa sapere su queste due variabili aleatorie chi quadro e Fischer in relazione dei rispettivi test? (Ho capito che la pdf e la cdf non mi verrà mai chiesta anche perché non è stata citata durante il corso e a quanto ho capito esistono le tabelle per cui posso eliminare questo problema che mi ero fatto)
2) Mi basta sapere solamente la loro forma? (Anche se non ho capito bene che intendete per forma, alla fine non è una distribuzione)
Grazie.
Sto studiando l'esame di misure elettroniche (ed è una confusione totale) e al momento sono alle prese con la parte di statistica. Ora ancor prima del test del chi quadro e del test di Fischer, io vorrei capire le seguenti cose:
1) Cosa mi interessa sapere su queste due variabili aleatorie chi quadro e Fischer in relazione dei rispettivi test? (Ho capito che la pdf e la cdf non mi verrà mai chiesta anche perché non è stata citata durante il corso e a quanto ho capito esistono le tabelle per cui posso eliminare questo problema che mi ero fatto)
2) Mi basta sapere solamente la loro forma? (Anche se non ho capito bene che intendete per forma, alla fine non è una distribuzione)
Grazie.
Beh, in relazione ai test allora forse ti conviene capire come usare le tabelle (che infatti eliminano il problema di conoscere la densità di queste variabili). Non che ci sia granchè da fare

"Arado90":
Beh, in relazione ai test allora forse ti conviene capire come usare le tabelle (che infatti eliminano il problema di conoscere la densità di queste variabili). Non che ci sia granchè da fare
Vorrei seguire un ordine cronologico degli argomenti, anche perché non posso fare al momento i test visto che mi mancano altre basi (seguo il programma del corso). Il fatto che l'esame che sto studiando è veramente una confusione assurda, e prima di impazzire vorrei cercare di sistemare (per quanto possibile) le cose. Allora in definitiva penso che per il momento devo sapere questo:
Per la v.a. chi quadro
Si definisce la variabile chi-quadrato $(chi_k)^2$ con k gradi di libertà come somma dei quadrati di k variabili normali indipendenti:
$\sum_{i=1}^\k \ ( Z_i ) ^ 2\ sim \ ( chi_k ) ^ 2$
La distribuzione è positiva con asimmetria positiva (ha la coda a sinistra se non sbaglio), media k e varianza 2k.
Il chi-quadrato è la tipica distribuzione collegata alle devianze campionarie. Infatti, se si hanno n osservazioni i.i.d. (indipendenti e identicamente distribuite se non erro) $X_i\sim\N(u, sigma^2)$:
$\sum_{i=1}^\k \ [( X_i - u)^2]/(sigma^2)\sim\(chi_n)^2$
ovvero ha distribuzione $(chi_n)^2$. Se al posto di u si sostituisce la media campionaria $hat(X)$, la stessa quantità ha una distribuzione $(chi^2)_(n-1)$, ossia ha la stessa forma ma perde un grado di libertà.
Non dovrei aver sbagliato gli indice delle varie sommatorie, almeno spero, inoltre per il momento mi basta sapere questo sulla chi quadro? Ma queste informazioni hanno dell'utilità ai fini del test (a prescindere che comunque le studierò lo stesso per cultura personale)?
Per la v.a. Fisher-Snedecor
La distribuzione F è la distribuzione del rapporto di due chi-quadro indipendenti. Più precisamente è il rapporto di due $chi^2$ indipendenti ognuno diviso per i suoi gradi di libertà, ovvero:
$(X/n)/(Y/m)\simF_{(n,m)}$ dove $X\simchi^2_n$ e $Y\simchi^2_m$
(Bene mi sono appena reso conto che se voglio capire questa parte devo fare anche la devianza campionaria ecc che sul programma non è stato segnato, quindi altro passo indietro!)
Grazie per gli aiuti!

1. L'asimmetria è un discorso a parte. Infatti quando i gradi di libertà diventano tanti (in genere si fissa $>50$) la curva è identica a quella della Normale standard, quindi simmetrica. E' asimmetricamente positiva fintanto che i gradi di libertà sono pochi.
2.
Se ci pensi questa è esattamente la stessa formula che vediamo dall'inizio e che hai citato anche te poco prima. Cioè se $X_i\simN(mu,sigma^2)$, la formula che hai scritto è la somma dei quadrati di $k$ normali standard indipendenti, cioè $\sum_{i=1}^k Z_i^2$
(E quindi è un $chi^2_k$)
Ai fini del test questo non ha una grande importanza, sono semplici informazioni sulla variabile che userai per il test, ma non ti serviranno direttamente.
2.
$\sum_{i=1}^k ((X_i-mu)^2)/sigma^2$
Se ci pensi questa è esattamente la stessa formula che vediamo dall'inizio e che hai citato anche te poco prima. Cioè se $X_i\simN(mu,sigma^2)$, la formula che hai scritto è la somma dei quadrati di $k$ normali standard indipendenti, cioè $\sum_{i=1}^k Z_i^2$

(E quindi è un $chi^2_k$)
Ai fini del test questo non ha una grande importanza, sono semplici informazioni sulla variabile che userai per il test, ma non ti serviranno direttamente.