Problemi di terminologia

Fioravante Patrone1
Ho [tex]X[/tex], v.a. reale.
Ho un campione [tex]X_1,\dots, X_n[/tex] (v.a. indipendenti e tutte distribuite come [tex]X[/tex]).


Chiamo [tex]\bar X_n[/tex] la v.a. [tex]\frac{X_1 + \dots + X_n}{n}[/tex]


Il numero:

[tex]{\mathbb{E}} \left[ \frac{1}{n} \sum_{k=1}^n \left(
X_k - \bar X_n \right)^2 \right][/tex]
come lo chiamate?



E il numero:

[tex]{\mathbb{E}} \left[ \frac{1}{n-1} \sum_{k=1}^{n} \left( X_k -
\bar X_n \right)^2 \right][/tex]
idem, come lo chiamate?

Risposte
DajeForte
sono i valori attesi
della varianza campionaria (la prima)
della varianza campionaria corretta (la seconda)

Arado90
E il primo vale $sigma^2-1/(n)sigma^2$.
E per questo si "corregge" la varianza campionaria; infatti il secondo vale esattamente $sigma^2$

Fioravante Patrone1
@Arado90

Grazie per la risposta, ma a me interessa solo "come chiamate" quei due oggetti, non le loro proprietà matematiche.

Rggb1
@Fioravante Patrone: Sono curioso sull'origine della domanda. Hai trovato terminologie differenti?

Fioravante Patrone1
@Rggb
beh, vista la domanda che avevo fatto, mi sa che era il segreto di Pulcinella...
Sì, ho trovato terminologie differenti. Mi piacerebbe sapere, dagli utenti del forum che vorranno rispondere, come sono abituati a chiamarle.

Rggb1
Non sono "abituato" a chiamarle, però (quando tornerò in ufficio) ricontrollerò anche sui miei vecchi libri.

adaBTTLS1
"DajeForte":
sono i valori attesi
della varianza campionaria (la prima)
della varianza campionaria corretta (la seconda)

per le definizioni che invece ho incontrato io, la varianza campionaria o empirica sarebbe la seconda, mentre la prima sarebbe semplicemente varianza.
(mi sono limitata a rivedere un mio vecchio testo, vedo però che la questione è aperta e merita un approfondimento...).

Fioravante Patrone1
"adaBTTLS":
vedo però che la questione è aperta e merita un approfondimento...
:drinkers:

Fioravante Patrone1
Ma, rispetto alla mia domanda, tu come le chiami?
Non siamo in un contesto di statistica descrittiva. Questo non è sufficiente, per il tuo dizionario, a "battezzarle"? Se sì, come le chiami?
Se no, quali dettagli mancano? Le chiameresti in altro modo in un altro contesto (esclusa la statistica descrittiva)?

adaBTTLS1
il libro consultato da ma è di probabilità, infatti, non di statistica.
nella "casetta" in cui sono ora, non ho testi significativi di statistica.
per approfondimento, intendevo per lo più via internet.
Fioravante potrebbe fornirci qualche link che illustri una non-corrispondenza tra le varie terminologie (o comunque quel che ha suscitato il suo dubbio e dunque questo topic)?

Fioravante Patrone1
Lo farò, ma preferirei non adesso.
Per ora mi limito a dire che ho trovato molta varietà nel modo di "chiamare" quei due oggetti.
Mi piacerebbe capire se c'è una denominazione più "consolidata" di altre.
E non mi spiacerebbe capire il perché della confusione che ho trovato.

Arado90
Secondo me la definizione più comune è quella di varianza campionaria e varianza campionaria corretta, almeno in ambito inferenziale (che è quello in cui siamo se parli di un campione).

Fioravante Patrone1
"Arado90":
Secondo me la definizione più comune è quella di varianza campionaria e varianza campionaria corretta, almeno in ambito inferenziale (che è quello in cui siamo se parli di un campione).

Cioè, intendi:
- varianza campionaria la prima (quella divisa per $n$)
- varianza campionaria corretta la seconda (quella divisa per $n-1$)

Arado90
Esatto.

Poi chiaramente la $E$ all'inizio rappresenta il valore atteso, quindi come ha detto DajeForte le due quantità sono il valore atteso della varianza campionaria (la prima) e il valore atteso della varianza campionaria corretta (la seconda)

Arado90
Però credo che da un punto di vista di "linguaggio" sia più facile associare alla prima formula, quella divisa per $n$, il termine varianza campionaria in quanto è identica alla formula della varianza, con la sola differenza che la $X$ qua è un campione.
E di conseguenza, dato che quella prima formula dà $(n-1)/nsigma^2$, la seconda formula è la varianza campionaria corretta ottenuta moltiplicando per l'inverso $n/(n-1)$ di modo che il risultato sia $sigma^2$ .

Rggb1
Piccolo estratto dal mio vecchio (vecchissimo) libro delle superiori; il grassetto l'ho messo io.

"Se $X_1, X_2, ..., Xn$ denotano le v.c. di un campione di grandezza $n$, allora la v.c. che ci fornisce la varianza del campione o varianza campionaria è definita da

$S^2 = ((X_1-bar X)^2+(X_2-bar X)^2+...+(X_n-bar X)^2)/n$ (*)

Precedentemente abbiamo trovato che $E(bar X)=mu$ e sarebbe bello se avessimo anche $E(S^2)=sigma^2$. (sic, ndr)
Quando il valore probabile di un riassunto è uguale al corrispondente parametro della popolazione, diremo che il riassunto è uno stimatore corretto e il valore una stima corretta di questo parametro. Si verifica però che

$E(S^2) = mu_s^2 = (n-1)/n * sigma^2$

che è molto vicino a $sigma^2$ solo per grandi valori di $n$ (diciamo $n>=30$). Lo stimatore corretto che desideriamo sarà definito da
$hat S ^2 = n/(n-1)*S^2 = ((X_1-bar X)^2+(X_2-bar X)^2+...+(X_n-bar X)^2)/(n-1)$
così che
$E(hat S ^2) = sigma^2$
A causa di ciò, alcuni statistici definiscono la varianza campionaria mediante $hat S^2$ piuttosto che mediante $S^2$ e sostituiscono semplicemente $n$ con $n-1$ nel denominatore della (*). Noi tuttavia continueremo a definire la varianza campionaria con la (*) perché in questo modo molti risultati successivi verranno semplificati."

Notare la differenza di notazione e anche la giustificazione "in questo modo ci torna meglio" ;)

Fioravante Patrone1
Bello! Appunto, che cento fiori fioriscano (cit. :P )

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.