T.l.c nel confronto non parametrico tra medie
Ciao a tutti pubblico un post per chiarire un dubbio...Quello che non mi è molto chiaro è la teoria della verifica di ipotesi in ambito non parametrico per il confronto tra le medie di 2 differenti campioni, ed è evidente che l'applicazione del teorema del limite centrale (t.l.c) è di notevole importanza.
E dal momento che c'è una contraddizione in quello che ho studiato, riporto l'interpretazione che ho dato sia al teorema del limite centrale, e allo stesso tempo quella che ho dato alla verifica d'ipotesi così mi direte( se volete e/o potete), se è sbagliata una delle due o entrambe.
Parto col t.l.c che ho suddiviso in 2 parti:
(I parte)
<< Se si estrae da una popolazione con distribuzione normale tutti i possibili campioni bernoulliani (cioè estratti con reinserimento), allora la distribuzione delle medie di tali campioni assume la forma di una normale con media $\mu$ e varianza $\sigma^2$/n>>. Formalmente:
Ipotesi:
Sia:
a) X= N($\mu$; $\sigma^2$) la distribuzione della popolazione
b) i campioni bernoulliani
c) $\barX_j$=$(X_j1+X_j2+...+X_jn)/(n_j)$ la media campionaria del j-imo campione
d) $\bar X= (\bar X_1 +\bar X_2+...+\bar X_j+... +\bar X_N)/N$ (la media di più combinazioni lineari, ciascuna delle quali è lo stimatore media campionaria...)
Tesi:
$\barX$=$N(\mu; \sigma^2/n)$ , e ne consegue che:
$\barx_1$,$\barx_2$,...,$\barx_n$, sono le medie delle osservazioni campionarie che si distribuiscono come una normale N($\mu$; $\sigma^2$).
(II parte = la più importante)
Se n>30, la distribuzione delle osservazioni $\barx_i$, approssima la normale con media $\mu$ e varianza $\sigma^2$/n, qualsiasi sia la distribuzione di probabilità. Formalmente:
Ipotesi:
a) funzione di densità della variabile casuale X = incognita.
b)n>30.
Tesi:
$\barX$=N($\mu$; $\sigma^2/n$) ....
(ricordando che $\barX$ è una combinazione lineare di combinazioni lineari, cioè di "stimatori medie campionarie")
Ora sorge il fatidico dubbio che sta mettendo a repentaglio tutte le convinzioni che mi sono fatto sul teorema del limite centrale:
quando si fa un confronto non parametrico tra medie di due campioni la statistica test è la seguente:
d= $|\barx_1-\barx_2|/(\sigma_1/sqrt(n_1)+\sigma_2/sqrt(n_2))$
poi il mio libro afferma che per $n_1$ ed $n_2$ sufficientemente grandi le variabili casuali dei due campioni, rispettivamente: $\barX_1$ e $\barX_2$ assumono la forma di una normale con varianza $\sigma^2$/n e media $\mu$ per poi ricavarsi la formula della variabile casuale D (per calcolare il p-value)...Io vi chiedo...E' possibile che ciò avvenga? Questa proprietà delle v.c delle medie campionarie SEMBREREBBERO contraddire quanto ho interpretato a riguardo del teorema del limite centrale.
Aspetto chiarimenti dallo staff di matematicamente ;-D
E dal momento che c'è una contraddizione in quello che ho studiato, riporto l'interpretazione che ho dato sia al teorema del limite centrale, e allo stesso tempo quella che ho dato alla verifica d'ipotesi così mi direte( se volete e/o potete), se è sbagliata una delle due o entrambe.
Parto col t.l.c che ho suddiviso in 2 parti:
(I parte)
<< Se si estrae da una popolazione con distribuzione normale tutti i possibili campioni bernoulliani (cioè estratti con reinserimento), allora la distribuzione delle medie di tali campioni assume la forma di una normale con media $\mu$ e varianza $\sigma^2$/n>>. Formalmente:
Ipotesi:
Sia:
a) X= N($\mu$; $\sigma^2$) la distribuzione della popolazione
b) i campioni bernoulliani
c) $\barX_j$=$(X_j1+X_j2+...+X_jn)/(n_j)$ la media campionaria del j-imo campione
d) $\bar X= (\bar X_1 +\bar X_2+...+\bar X_j+... +\bar X_N)/N$ (la media di più combinazioni lineari, ciascuna delle quali è lo stimatore media campionaria...)
Tesi:
$\barX$=$N(\mu; \sigma^2/n)$ , e ne consegue che:
$\barx_1$,$\barx_2$,...,$\barx_n$, sono le medie delle osservazioni campionarie che si distribuiscono come una normale N($\mu$; $\sigma^2$).
(II parte = la più importante)
Se n>30, la distribuzione delle osservazioni $\barx_i$, approssima la normale con media $\mu$ e varianza $\sigma^2$/n, qualsiasi sia la distribuzione di probabilità. Formalmente:
Ipotesi:
a) funzione di densità della variabile casuale X = incognita.
b)n>30.
Tesi:
$\barX$=N($\mu$; $\sigma^2/n$) ....
(ricordando che $\barX$ è una combinazione lineare di combinazioni lineari, cioè di "stimatori medie campionarie")
Ora sorge il fatidico dubbio che sta mettendo a repentaglio tutte le convinzioni che mi sono fatto sul teorema del limite centrale:
quando si fa un confronto non parametrico tra medie di due campioni la statistica test è la seguente:
d= $|\barx_1-\barx_2|/(\sigma_1/sqrt(n_1)+\sigma_2/sqrt(n_2))$
poi il mio libro afferma che per $n_1$ ed $n_2$ sufficientemente grandi le variabili casuali dei due campioni, rispettivamente: $\barX_1$ e $\barX_2$ assumono la forma di una normale con varianza $\sigma^2$/n e media $\mu$ per poi ricavarsi la formula della variabile casuale D (per calcolare il p-value)...Io vi chiedo...E' possibile che ciò avvenga? Questa proprietà delle v.c delle medie campionarie SEMBREREBBERO contraddire quanto ho interpretato a riguardo del teorema del limite centrale.
Aspetto chiarimenti dallo staff di matematicamente ;-D
Risposte
62 visite, ancora nessun responso...Davvero un peccato...
Adesso 77
E' giusto il t.l.c