Problemi di terminologia
Ho [tex]X[/tex], v.a. reale.
Ho un campione [tex]X_1,\dots, X_n[/tex] (v.a. indipendenti e tutte distribuite come [tex]X[/tex]).
Chiamo [tex]\bar X_n[/tex] la v.a. [tex]\frac{X_1 + \dots + X_n}{n}[/tex]
Il numero:
[tex]{\mathbb{E}} \left[ \frac{1}{n} \sum_{k=1}^n \left(
X_k - \bar X_n \right)^2 \right][/tex]
come lo chiamate?
E il numero:
[tex]{\mathbb{E}} \left[ \frac{1}{n-1} \sum_{k=1}^{n} \left( X_k -
\bar X_n \right)^2 \right][/tex]
idem, come lo chiamate?
Ho un campione [tex]X_1,\dots, X_n[/tex] (v.a. indipendenti e tutte distribuite come [tex]X[/tex]).
Chiamo [tex]\bar X_n[/tex] la v.a. [tex]\frac{X_1 + \dots + X_n}{n}[/tex]
Il numero:
[tex]{\mathbb{E}} \left[ \frac{1}{n} \sum_{k=1}^n \left(
X_k - \bar X_n \right)^2 \right][/tex]
come lo chiamate?
E il numero:
[tex]{\mathbb{E}} \left[ \frac{1}{n-1} \sum_{k=1}^{n} \left( X_k -
\bar X_n \right)^2 \right][/tex]
idem, come lo chiamate?
Risposte
sono i valori attesi
della varianza campionaria (la prima)
della varianza campionaria corretta (la seconda)
della varianza campionaria (la prima)
della varianza campionaria corretta (la seconda)
E il primo vale $sigma^2-1/(n)sigma^2$.
E per questo si "corregge" la varianza campionaria; infatti il secondo vale esattamente $sigma^2$
E per questo si "corregge" la varianza campionaria; infatti il secondo vale esattamente $sigma^2$
@Arado90
Grazie per la risposta, ma a me interessa solo "come chiamate" quei due oggetti, non le loro proprietà matematiche.
Grazie per la risposta, ma a me interessa solo "come chiamate" quei due oggetti, non le loro proprietà matematiche.
@Fioravante Patrone: Sono curioso sull'origine della domanda. Hai trovato terminologie differenti?
@Rggb
beh, vista la domanda che avevo fatto, mi sa che era il segreto di Pulcinella...
Sì, ho trovato terminologie differenti. Mi piacerebbe sapere, dagli utenti del forum che vorranno rispondere, come sono abituati a chiamarle.
beh, vista la domanda che avevo fatto, mi sa che era il segreto di Pulcinella...
Sì, ho trovato terminologie differenti. Mi piacerebbe sapere, dagli utenti del forum che vorranno rispondere, come sono abituati a chiamarle.
Non sono "abituato" a chiamarle, però (quando tornerò in ufficio) ricontrollerò anche sui miei vecchi libri.
"DajeForte":
sono i valori attesi
della varianza campionaria (la prima)
della varianza campionaria corretta (la seconda)
per le definizioni che invece ho incontrato io, la varianza campionaria o empirica sarebbe la seconda, mentre la prima sarebbe semplicemente varianza.
(mi sono limitata a rivedere un mio vecchio testo, vedo però che la questione è aperta e merita un approfondimento...).
"adaBTTLS":
vedo però che la questione è aperta e merita un approfondimento...

Ma, rispetto alla mia domanda, tu come le chiami?
Non siamo in un contesto di statistica descrittiva. Questo non è sufficiente, per il tuo dizionario, a "battezzarle"? Se sì, come le chiami?
Se no, quali dettagli mancano? Le chiameresti in altro modo in un altro contesto (esclusa la statistica descrittiva)?
Non siamo in un contesto di statistica descrittiva. Questo non è sufficiente, per il tuo dizionario, a "battezzarle"? Se sì, come le chiami?
Se no, quali dettagli mancano? Le chiameresti in altro modo in un altro contesto (esclusa la statistica descrittiva)?
il libro consultato da ma è di probabilità, infatti, non di statistica.
nella "casetta" in cui sono ora, non ho testi significativi di statistica.
per approfondimento, intendevo per lo più via internet.
Fioravante potrebbe fornirci qualche link che illustri una non-corrispondenza tra le varie terminologie (o comunque quel che ha suscitato il suo dubbio e dunque questo topic)?
nella "casetta" in cui sono ora, non ho testi significativi di statistica.
per approfondimento, intendevo per lo più via internet.
Fioravante potrebbe fornirci qualche link che illustri una non-corrispondenza tra le varie terminologie (o comunque quel che ha suscitato il suo dubbio e dunque questo topic)?
Lo farò, ma preferirei non adesso.
Per ora mi limito a dire che ho trovato molta varietà nel modo di "chiamare" quei due oggetti.
Mi piacerebbe capire se c'è una denominazione più "consolidata" di altre.
E non mi spiacerebbe capire il perché della confusione che ho trovato.
Per ora mi limito a dire che ho trovato molta varietà nel modo di "chiamare" quei due oggetti.
Mi piacerebbe capire se c'è una denominazione più "consolidata" di altre.
E non mi spiacerebbe capire il perché della confusione che ho trovato.
Secondo me la definizione più comune è quella di varianza campionaria e varianza campionaria corretta, almeno in ambito inferenziale (che è quello in cui siamo se parli di un campione).
"Arado90":
Secondo me la definizione più comune è quella di varianza campionaria e varianza campionaria corretta, almeno in ambito inferenziale (che è quello in cui siamo se parli di un campione).
Cioè, intendi:
- varianza campionaria la prima (quella divisa per $n$)
- varianza campionaria corretta la seconda (quella divisa per $n-1$)
Esatto.
Poi chiaramente la $E$ all'inizio rappresenta il valore atteso, quindi come ha detto DajeForte le due quantità sono il valore atteso della varianza campionaria (la prima) e il valore atteso della varianza campionaria corretta (la seconda)
Poi chiaramente la $E$ all'inizio rappresenta il valore atteso, quindi come ha detto DajeForte le due quantità sono il valore atteso della varianza campionaria (la prima) e il valore atteso della varianza campionaria corretta (la seconda)
Però credo che da un punto di vista di "linguaggio" sia più facile associare alla prima formula, quella divisa per $n$, il termine varianza campionaria in quanto è identica alla formula della varianza, con la sola differenza che la $X$ qua è un campione.
E di conseguenza, dato che quella prima formula dà $(n-1)/nsigma^2$, la seconda formula è la varianza campionaria corretta ottenuta moltiplicando per l'inverso $n/(n-1)$ di modo che il risultato sia $sigma^2$ .
E di conseguenza, dato che quella prima formula dà $(n-1)/nsigma^2$, la seconda formula è la varianza campionaria corretta ottenuta moltiplicando per l'inverso $n/(n-1)$ di modo che il risultato sia $sigma^2$ .
Piccolo estratto dal mio vecchio (vecchissimo) libro delle superiori; il grassetto l'ho messo io.
"Se $X_1, X_2, ..., Xn$ denotano le v.c. di un campione di grandezza $n$, allora la v.c. che ci fornisce la varianza del campione o varianza campionaria è definita da
$S^2 = ((X_1-bar X)^2+(X_2-bar X)^2+...+(X_n-bar X)^2)/n$ (*)
Precedentemente abbiamo trovato che $E(bar X)=mu$ e sarebbe bello se avessimo anche $E(S^2)=sigma^2$. (sic, ndr)
Quando il valore probabile di un riassunto è uguale al corrispondente parametro della popolazione, diremo che il riassunto è uno stimatore corretto e il valore una stima corretta di questo parametro. Si verifica però che
$E(S^2) = mu_s^2 = (n-1)/n * sigma^2$
che è molto vicino a $sigma^2$ solo per grandi valori di $n$ (diciamo $n>=30$). Lo stimatore corretto che desideriamo sarà definito da
$hat S ^2 = n/(n-1)*S^2 = ((X_1-bar X)^2+(X_2-bar X)^2+...+(X_n-bar X)^2)/(n-1)$
così che
$E(hat S ^2) = sigma^2$
A causa di ciò, alcuni statistici definiscono la varianza campionaria mediante $hat S^2$ piuttosto che mediante $S^2$ e sostituiscono semplicemente $n$ con $n-1$ nel denominatore della (*). Noi tuttavia continueremo a definire la varianza campionaria con la (*) perché in questo modo molti risultati successivi verranno semplificati."
Notare la differenza di notazione e anche la giustificazione "in questo modo ci torna meglio"
"Se $X_1, X_2, ..., Xn$ denotano le v.c. di un campione di grandezza $n$, allora la v.c. che ci fornisce la varianza del campione o varianza campionaria è definita da
$S^2 = ((X_1-bar X)^2+(X_2-bar X)^2+...+(X_n-bar X)^2)/n$ (*)
Precedentemente abbiamo trovato che $E(bar X)=mu$ e sarebbe bello se avessimo anche $E(S^2)=sigma^2$. (sic, ndr)
Quando il valore probabile di un riassunto è uguale al corrispondente parametro della popolazione, diremo che il riassunto è uno stimatore corretto e il valore una stima corretta di questo parametro. Si verifica però che
$E(S^2) = mu_s^2 = (n-1)/n * sigma^2$
che è molto vicino a $sigma^2$ solo per grandi valori di $n$ (diciamo $n>=30$). Lo stimatore corretto che desideriamo sarà definito da
$hat S ^2 = n/(n-1)*S^2 = ((X_1-bar X)^2+(X_2-bar X)^2+...+(X_n-bar X)^2)/(n-1)$
così che
$E(hat S ^2) = sigma^2$
A causa di ciò, alcuni statistici definiscono la varianza campionaria mediante $hat S^2$ piuttosto che mediante $S^2$ e sostituiscono semplicemente $n$ con $n-1$ nel denominatore della (*). Noi tuttavia continueremo a definire la varianza campionaria con la (*) perché in questo modo molti risultati successivi verranno semplificati."
Notare la differenza di notazione e anche la giustificazione "in questo modo ci torna meglio"

Bello! Appunto, che cento fiori fioriscano (cit.
)
