Intervalli confidenza rapporto varianze
Ciao, amici! Dati i campioni gaussiani indipendenti \(X_1,...,X_n\sim\mathcal{N}(\mu_1,\sigma_1^2)\) e \(Y_1,...,Y_m\sim\mathcal{N}(\mu_2,\sigma_2^2)\) vorrei determinare un intervallo di confidenza ad un livello $1-\alpha$ nei due casi in cui i valori attesi siano ignoti oppure noti.
Nel primo caso, sapendo che \((n-1)\frac{S_1^2}{\sigma_1^2}\sim\chi_{n-1}^2\) (chiamando $S_1^2$ la varianza campionaria del primo campione), direi che \(\frac{\sigma_1^2 S_2^2}{\sigma_2^2 S_1^2}\sim F_{(m-1),(n-1)} \), cioè ha distribuzione $F$ di Fisher con $m-1$ e $n-1$ gradi di libertà.
Con un pochino di algebra elementare e chiamando $F_{\alpha,n,m}$ il valore tale che* \(P(F_{n,m}>F_{\alpha,n,m})=\alpha\), tenendo presente che \(F_{\alpha,n,m}=(F_{(1-\alpha),m,n})^{-1}\), ottengo che\[P\Bigg(\frac{S_1^2}{F_{\frac{\alpha}{2},(n-1),(m-1)}S_2^2}<\frac{\sigma_1^2}{\sigma_2^2}<\frac{F_{\frac{\alpha}{2},(m-1),(n-1)}S_1^2}{S_2^2}\Bigg)=1-\alpha=P\Bigg(\frac{\sigma_1^2}{\sigma_2^2}<\frac{F_{\alpha,(m-1),(n-1)}S_1^2}{S_2^2}\Bigg) \]
e analogamente, se si conoscono le $\mu_i$, osservando che \(\sum_{i=1}^{n} \frac{(X_i-\mu_1)^2}{\sigma_1^2} \sim\chi_{n}^2\), direi che \(\frac{n\sigma_1^2
\sum_{i=1}^{n}(Y_i-\mu_2)^2}{m\sigma_2^2\sum_{i=1}^{n}(X_i-\mu_1)^2}\sim F_{m,n}\) e calcolerei\[P\Bigg(\frac{m\sum_{i=1}^{n}(X_i-\mu_1)^2}{F_{\frac{\alpha}{2},n,m}n\sum_{i=1}^{n}(Y_i-\mu_2)^2}<\frac{\sigma_1^2}{\sigma_2^2}<\frac{F_{\frac{\alpha}{2},m,n}m\sum_{i=1}^{n}(X_i-\mu_1)^2}{n\sum_{i=1}^{n}(Y_i-\mu_2)^2}\Bigg)=1-\alpha=P\Bigg(\frac{\sigma_1^2}{\sigma_2^2}<\frac{F_{\alpha,m,n}m\sum_{i=1}^{n}(X_i-\mu_1)^2}{n\sum_{i=1}^{n}(Y_i-\mu_2)^2}\Bigg)\]
Faccio presente che ho preferito utilizzare dei valori di tipo $F_{\alpha,n,m}$ piuttosto che $F_{1-\alpha,m,n}$ per praticità di utilizzo successivo della formula, dato che le tabelle normalmente forniscono $F_{\alpha,n,m}$ per $\alpha$ "piccolo", mentre nelle applicazioni normalmente si richiede che $1-\alpha$ sia vicino ad $1$.
Vi sembra corretto?
Grazie di cuore a tutti!!!
*tengo a sottolineare che uso la notazione del mio testo, il Ross, perché ho l'impressione che da autore ad autore la stessa notazione si usi per cose diverse e nella fattispecie mi pare che alcuni usino $F_{\alpha,n,m}$ con la diseguaglianza opposta... sbaglio?
Nel primo caso, sapendo che \((n-1)\frac{S_1^2}{\sigma_1^2}\sim\chi_{n-1}^2\) (chiamando $S_1^2$ la varianza campionaria del primo campione), direi che \(\frac{\sigma_1^2 S_2^2}{\sigma_2^2 S_1^2}\sim F_{(m-1),(n-1)} \), cioè ha distribuzione $F$ di Fisher con $m-1$ e $n-1$ gradi di libertà.
Con un pochino di algebra elementare e chiamando $F_{\alpha,n,m}$ il valore tale che* \(P(F_{n,m}>F_{\alpha,n,m})=\alpha\), tenendo presente che \(F_{\alpha,n,m}=(F_{(1-\alpha),m,n})^{-1}\), ottengo che\[P\Bigg(\frac{S_1^2}{F_{\frac{\alpha}{2},(n-1),(m-1)}S_2^2}<\frac{\sigma_1^2}{\sigma_2^2}<\frac{F_{\frac{\alpha}{2},(m-1),(n-1)}S_1^2}{S_2^2}\Bigg)=1-\alpha=P\Bigg(\frac{\sigma_1^2}{\sigma_2^2}<\frac{F_{\alpha,(m-1),(n-1)}S_1^2}{S_2^2}\Bigg) \]
e analogamente, se si conoscono le $\mu_i$, osservando che \(\sum_{i=1}^{n} \frac{(X_i-\mu_1)^2}{\sigma_1^2} \sim\chi_{n}^2\), direi che \(\frac{n\sigma_1^2
\sum_{i=1}^{n}(Y_i-\mu_2)^2}{m\sigma_2^2\sum_{i=1}^{n}(X_i-\mu_1)^2}\sim F_{m,n}\) e calcolerei\[P\Bigg(\frac{m\sum_{i=1}^{n}(X_i-\mu_1)^2}{F_{\frac{\alpha}{2},n,m}n\sum_{i=1}^{n}(Y_i-\mu_2)^2}<\frac{\sigma_1^2}{\sigma_2^2}<\frac{F_{\frac{\alpha}{2},m,n}m\sum_{i=1}^{n}(X_i-\mu_1)^2}{n\sum_{i=1}^{n}(Y_i-\mu_2)^2}\Bigg)=1-\alpha=P\Bigg(\frac{\sigma_1^2}{\sigma_2^2}<\frac{F_{\alpha,m,n}m\sum_{i=1}^{n}(X_i-\mu_1)^2}{n\sum_{i=1}^{n}(Y_i-\mu_2)^2}\Bigg)\]
Faccio presente che ho preferito utilizzare dei valori di tipo $F_{\alpha,n,m}$ piuttosto che $F_{1-\alpha,m,n}$ per praticità di utilizzo successivo della formula, dato che le tabelle normalmente forniscono $F_{\alpha,n,m}$ per $\alpha$ "piccolo", mentre nelle applicazioni normalmente si richiede che $1-\alpha$ sia vicino ad $1$.
Vi sembra corretto?
Grazie di cuore a tutti!!!
*tengo a sottolineare che uso la notazione del mio testo, il Ross, perché ho l'impressione che da autore ad autore la stessa notazione si usi per cose diverse e nella fattispecie mi pare che alcuni usino $F_{\alpha,n,m}$ con la diseguaglianza opposta... sbaglio?
Risposte
Ciao,
non capisco cosa tu voglia dire con questo. Il valore atteso che sia noto o meno non implica minimamente il calcolo di un intervallo di confidenza, un test, ...
Vuoi differenziare i due casi solo per i conti? che conoscendola puoi calcolare lo stimatore o meno?
"DavideGenova":
vorrei determinare un intervallo di confidenza ad un livello $1-\alpha$ nei due casi in cui i valori attesi siano ignoti oppure noti.
non capisco cosa tu voglia dire con questo. Il valore atteso che sia noto o meno non implica minimamente il calcolo di un intervallo di confidenza, un test, ...
Vuoi differenziare i due casi solo per i conti? che conoscendola puoi calcolare lo stimatore o meno?
Grazie di cuore, hamming! Sono alle prime armi con queste cose, ma direi che, se non conosco $\mu_1$ e $\mu_2$ posso utilizzare il fatto che \(\frac{\sum_{i=1}^{n}(X_i-\bar{X})^2}{\sigma_1^2}\sim\chi_{n-1}^2\) e \(\frac{\sum_{i=1}^{m}(Y_i-\bar{Y})^2}{\sigma_2^2}\sim\chi_{m-1}^2\), mentre se le conosco ho a disposizione una distribuzione $F_{m,n}$ utilizzando il fatto che \(\frac{\sum_{i=1}^{n}(X_i-\mu_1)^2}{\sigma_1^2}\sim\chi_{n}^2\) e \(\frac{\sum_{i=1}^{m}(Y_i-\mu_2)^2}{\sigma_2^2}\sim\chi_{m}^2\), nel qual caso ho l'impressione che si possa spesso ottenere un intervallo di confidenza "migliore", similmente a quanto accade ad esempio con la stima del valore atteso se si conosce o no la varianza...
Od ho le travegole (evento la cui probabilità è $1-\alpha$ con $\alpha$ molto, molto piccolo...)?
Od ho le travegole (evento la cui probabilità è $1-\alpha$ con $\alpha$ molto, molto piccolo...)?
ok, ho capito cosa intendi ora. Scusa la "frettolosità", ma mi son perso nei meandri della notazione. 
sensato senza dubbio, è corretto differenziare nei due casi e l'utilizzo dello stimatore. Nei calcoli "mi fido", alla fine è l'applicazione di un'uguaglianza (doppia..), ma domani vedo di darti conferma esatta di quell'intervallo con l'utilizzo di quell'inversione, consultando anche il Baldi (ad occhio è accettabile).

"DavideGenova":
Vi sembra corretto?
sensato senza dubbio, è corretto differenziare nei due casi e l'utilizzo dello stimatore. Nei calcoli "mi fido", alla fine è l'applicazione di un'uguaglianza (doppia..), ma domani vedo di darti conferma esatta di quell'intervallo con l'utilizzo di quell'inversione, consultando anche il Baldi (ad occhio è accettabile).
Si utilizza abbondantemente il corollario principale del teorema di Cochran. Come accennavi è vero che a seconda dell'autore cambia la definizione di F, ma sono tutte equivalenti, basta stare attenti al tipo di uguaglianze ed agli swap che si applicano.
ma alcune cose:
- attento agli indici delle sommatorie (ci son troppe $n$)
- consiglio di utilizzare una notazione meno accecante annotando con \(\bar{\sigma}_2^2 = \sum_{i=1}^{m}(Y_i-\mu_2)^2\).
- hai calcolato due tipi di intervalli, quello unilaterale e bilaterale.
Utilizzando alcune proprietà sembra tornare, ma leggendo meglio non vorrei tu abbia utilizzato due proprietà mischiandole:
mi faresti vedere come passi a $P(...)= 1-\alpha$, utilizzando la notazione compatta di F, poi ti dico il mio dubbio.
ma alcune cose:
- attento agli indici delle sommatorie (ci son troppe $n$)
- consiglio di utilizzare una notazione meno accecante annotando con \(\bar{\sigma}_2^2 = \sum_{i=1}^{m}(Y_i-\mu_2)^2\).
- hai calcolato due tipi di intervalli, quello unilaterale e bilaterale.
Utilizzando alcune proprietà sembra tornare, ma leggendo meglio non vorrei tu abbia utilizzato due proprietà mischiandole:
"DavideGenova":
chiamando $F_{\alpha,n,m}$ il valore tale che* \(P(F_{n,m}>F_{\alpha,n,m})=\alpha\), tenendo presente che \(F_{\alpha,n,m}=(F_{(1-\alpha),m,n})^{-1}\)
mi faresti vedere come passi a $P(...)= 1-\alpha$, utilizzando la notazione compatta di F, poi ti dico il mio dubbio.
"hamming_burst":Sì, sì. A destra, in entrambi i casi, ho scritto la probabilità da cui ricavo l'intervallo di confidenza.
hai calcolato due tipi di intervalli, quello unilaterale e bilaterale.
"hamming_burst":
mi faresti vedere come passi a $ P(...)= 1-\alpha $, utilizzando la notazione compatta di F, poi ti dico il mio dubbio.
So che una variabile con distribuzione $F$ di Fisher con $m$ e $n$ gradi di libertà è -il mio testo la dà proprio come definizione- \(F_{m,n}=\frac{n\chi_m^2}{m\chi_n^2}\). Definendo $\bar{\sigma}_2^2$ come hai fatto tu e analogamente \( \bar{\sigma}_1^2 = \sum_{i=1}^{n}(X_i-\mu_1)^2 \) e sapendo che \(\frac{\bar{\sigma}_2^2}{\sigma_2^2}\sim\chi_m^2\) e \(\frac{\bar{\sigma}_1^2}{\sigma_1^2}\sim\chi_n^2\) direi proprio che\[\frac{n\bar{\sigma}_2^2 \sigma_1^2}{m \sigma_2^2\bar{\sigma}_1^2}\sim F_{m,n}\]
Tenendo conto che mi pare che, per una variabile $F_{m,n}$ con tale distribuzione, usando le notazioni che ho usato anche in precedenza, si abbia (notare l'ordine degli indici $m$ e $n$)\[P(F_{1-\frac{\alpha}{2},m,n}
Do i numeri?
$\infty$ grazie ancora!!!
$\infty$ grazie anche a te, Sergio!
Quindi ho un'ulteriore conferma della non-universalità della notazione cui mi ha abituato il Ross: infatti sono abituato a scrivere \(P(F_{n,m}>F_{\alpha,n,m})=\alpha\) e la prima volta che ho trovato delle formule in Internet che mi facevano supporre che si stesse chiamando $F_{\alpha,n,m}$ l'\((\alpha\cdot 100)\)-esimo quantile sono andato un po' in confusione.
Per il punto 1 vedo che concordi con me.
Per il punto 2, in base a quanto dice il mio testo sotto la (6.5.4), considerando che \(n\frac{S_{0_1}^2}{\sigma_1^2}=\frac{\sum_{i=1}^n (X_i-\mu_1)^2}{\sigma_1^2}\) è distribuita come $\chi_n^2$ e \(m\frac{S_{0_2}^2}{\sigma_2^2}=\frac{\sum_{i=1}^m (Y_i-\mu_2)^2}{\sigma_2^2}\) come $\chi_m^2$ (sbagliato?) direi proprio che la conclusione è la stessa, notando che ho chiamato $F_{\alpha,n,m}$ l'\(((1-\alpha)\cdot 100)\)-esimo quantile.
Grazie di cuore a tutti e due!!!
Quindi ho un'ulteriore conferma della non-universalità della notazione cui mi ha abituato il Ross: infatti sono abituato a scrivere \(P(F_{n,m}>F_{\alpha,n,m})=\alpha\) e la prima volta che ho trovato delle formule in Internet che mi facevano supporre che si stesse chiamando $F_{\alpha,n,m}$ l'\((\alpha\cdot 100)\)-esimo quantile sono andato un po' in confusione.
Per il punto 1 vedo che concordi con me.
Per il punto 2, in base a quanto dice il mio testo sotto la (6.5.4), considerando che \(n\frac{S_{0_1}^2}{\sigma_1^2}=\frac{\sum_{i=1}^n (X_i-\mu_1)^2}{\sigma_1^2}\) è distribuita come $\chi_n^2$ e \(m\frac{S_{0_2}^2}{\sigma_2^2}=\frac{\sum_{i=1}^m (Y_i-\mu_2)^2}{\sigma_2^2}\) come $\chi_m^2$ (sbagliato?) direi proprio che la conclusione è la stessa, notando che ho chiamato $F_{\alpha,n,m}$ l'\(((1-\alpha)\cdot 100)\)-esimo quantile.
Grazie di cuore a tutti e due!!!