Dalla deviazione standard teorica a quella statistica
Su diversi testi di analisi dei dati sperimentali è riportata una dimostrazione del fatto che la media aritmetica di variabili casuali può essere considerata come miglior stima della media per la parent distribution e la deviazione standard statistica $ \sqrt{\frac{1}{n-1} \sum_{i=1}^{n}(x_i-\bar{x})} $ può essere considerata anch'essa come migliore stima dell'errore di ciascuna misura. La dimostrazione sostanzialmente si serve del principio di massima verosimiglianza applicato alla densità di probabilità relativa ai valori $x_1,...,n_n$ ottenuti mediante le misurazioni.
Una volta che si calcola la derivata di tale funzione rispetto alla variabile $\sigma$ della parent distribution si ottiene che la probabilità massima si ha per $ \sqrt{\frac{1}{n} \sum_{i=1}^{n}(x_i-\bar{x})} $, ossia la dev standard teorica. Tuttavia a questo punto il testo da cui ho letto la dimostrazione afferma che essendo $\bar{x}$ una stima (seppur la migliore possibile) della media relativa alla parent distribution , la dev standard teorica è una sottostima dell'errore che può essere corretta mediante l'introduzione della dev standard statistica (con $n-1$ al denominatore per intenderci).
Come si può dimostrare questo passaggio?
L'idea fondamentale è quella di stimare la differenza tra la dev standard teorica calcolata mediante la media della parent distribution e quella calcolata mediante una stima della media ottenuta come media aritmetica dei dati considerati. Successivamente si dovrebbe ricavare che tale differenza può essere quantificata con un fattore $\sqrt{\frac{n}{n-1}}$ ...tuttavia non so da dove iniziare. Chi mi aiuterebbe?
Una volta che si calcola la derivata di tale funzione rispetto alla variabile $\sigma$ della parent distribution si ottiene che la probabilità massima si ha per $ \sqrt{\frac{1}{n} \sum_{i=1}^{n}(x_i-\bar{x})} $, ossia la dev standard teorica. Tuttavia a questo punto il testo da cui ho letto la dimostrazione afferma che essendo $\bar{x}$ una stima (seppur la migliore possibile) della media relativa alla parent distribution , la dev standard teorica è una sottostima dell'errore che può essere corretta mediante l'introduzione della dev standard statistica (con $n-1$ al denominatore per intenderci).
Come si può dimostrare questo passaggio?
L'idea fondamentale è quella di stimare la differenza tra la dev standard teorica calcolata mediante la media della parent distribution e quella calcolata mediante una stima della media ottenuta come media aritmetica dei dati considerati. Successivamente si dovrebbe ricavare che tale differenza può essere quantificata con un fattore $\sqrt{\frac{n}{n-1}}$ ...tuttavia non so da dove iniziare. Chi mi aiuterebbe?
Risposte
Grazie per la risposta! Ho cercato di seguire il tuo messaggio, e per capirlo meglio dovrò prima terminare lo studio di argomenti importanti quali la distribuzione del $ \chi ^2$. Tuttavia vorrei chiedere un parere riguardo questo accenno di dimostrazione : se si considera come stima della varianza la media degli scarti al quadrato , si ha in realtà che gli scarti non sono tutti indipendenti tra loro; se i dati sono $n$ , di cui si conosce la media, e si conoscono $n-1$ di questi , allora si può da questi dati ricavare l'n-esimo. Le quantità indipendenti dovrebbero quindi essere $n-1$ , e ciò è dovuto al fatto che non si conosce la media della parent distribution. In effetti se si conoscesse le quantità indipendenti sarebbero $n$ la migliore stima per la varianza sarebbe la media degli scarti al quadrato