Problemi di terminologia

Fai una domanda Tutte le categorie

Fioravante Patrone1

1 giu 2010, 23:44

Ho [tex]X[/tex], v.a. reale.
Ho un campione [tex]X_1,\dots, X_n[/tex] (v.a. indipendenti e tutte distribuite come [tex]X[/tex]).

Chiamo [tex]\bar X_n[/tex] la v.a. [tex]\frac{X_1 + \dots + X_n}{n}[/tex]

Il numero:

[tex]{\mathbb{E}} \left[ \frac{1}{n} \sum_{k=1}^n \left(
X_k - \bar X_n \right)^2 \right][/tex]
come lo chiamate?

E il numero:

[tex]{\mathbb{E}} \left[ \frac{1}{n-1} \sum_{k=1}^{n} \left( X_k -
\bar X_n \right)^2 \right][/tex]
idem, come lo chiamate?

Risposte

DajeForte

1 giu 2010, 22:44

sono i valori attesi
della varianza campionaria (la prima)
della varianza campionaria corretta (la seconda)

Arado90

1 giu 2010, 22:56

E il primo vale $sigma^2-1/(n)sigma^2$.
E per questo si "corregge" la varianza campionaria; infatti il secondo vale esattamente $sigma^2$

Fioravante Patrone1

1 giu 2010, 22:59

@Arado90

Grazie per la risposta, ma a me interessa solo "come chiamate" quei due oggetti, non le loro proprietà matematiche.

Rggb1

1 giu 2010, 23:10

@Fioravante Patrone: Sono curioso sull'origine della domanda. Hai trovato terminologie differenti?

Fioravante Patrone1

1 giu 2010, 23:19

@Rggb
beh, vista la domanda che avevo fatto, mi sa che era il segreto di Pulcinella...
Sì, ho trovato terminologie differenti. Mi piacerebbe sapere, dagli utenti del forum che vorranno rispondere, come sono abituati a chiamarle.

Rggb1

1 giu 2010, 23:32

Non sono "abituato" a chiamarle, però (quando tornerò in ufficio) ricontrollerò anche sui miei vecchi libri.

adaBTTLS1

2 giu 2010, 16:13

"DajeForte":
sono i valori attesi
della varianza campionaria (la prima)
della varianza campionaria corretta (la seconda)

per le definizioni che invece ho incontrato io, la varianza campionaria o empirica sarebbe la seconda, mentre la prima sarebbe semplicemente varianza.
(mi sono limitata a rivedere un mio vecchio testo, vedo però che la questione è aperta e merita un approfondimento...).

Fioravante Patrone1

2 giu 2010, 16:30

"adaBTTLS":
vedo però che la questione è aperta e merita un approfondimento...

Fioravante Patrone1

2 giu 2010, 17:53

Ma, rispetto alla mia domanda, tu come le chiami?
Non siamo in un contesto di statistica descrittiva. Questo non è sufficiente, per il tuo dizionario, a "battezzarle"? Se sì, come le chiami?
Se no, quali dettagli mancano? Le chiameresti in altro modo in un altro contesto (esclusa la statistica descrittiva)?

adaBTTLS1

2 giu 2010, 18:29

il libro consultato da ma è di probabilità, infatti, non di statistica.
nella "casetta" in cui sono ora, non ho testi significativi di statistica.
per approfondimento, intendevo per lo più via internet.
Fioravante potrebbe fornirci qualche link che illustri una non-corrispondenza tra le varie terminologie (o comunque quel che ha suscitato il suo dubbio e dunque questo topic)?

Fioravante Patrone1

2 giu 2010, 19:53

Lo farò, ma preferirei non adesso.
Per ora mi limito a dire che ho trovato molta varietà nel modo di "chiamare" quei due oggetti.
Mi piacerebbe capire se c'è una denominazione più "consolidata" di altre.
E non mi spiacerebbe capire il perché della confusione che ho trovato.

Arado90

2 giu 2010, 19:56

Secondo me la definizione più comune è quella di varianza campionaria e varianza campionaria corretta, almeno in ambito inferenziale (che è quello in cui siamo se parli di un campione).

Fioravante Patrone1

2 giu 2010, 20:08

"Arado90":
Secondo me la definizione più comune è quella di varianza campionaria e varianza campionaria corretta, almeno in ambito inferenziale (che è quello in cui siamo se parli di un campione).

Cioè, intendi:
- varianza campionaria la prima (quella divisa per $n$)
- varianza campionaria corretta la seconda (quella divisa per $n-1$)

Arado90

2 giu 2010, 20:18

Esatto.

Poi chiaramente la $E$ all'inizio rappresenta il valore atteso, quindi come ha detto DajeForte le due quantità sono il valore atteso della varianza campionaria (la prima) e il valore atteso della varianza campionaria corretta (la seconda)

Arado90

2 giu 2010, 21:25

Però credo che da un punto di vista di "linguaggio" sia più facile associare alla prima formula, quella divisa per $n$, il termine varianza campionaria in quanto è identica alla formula della varianza, con la sola differenza che la $X$ qua è un campione.
E di conseguenza, dato che quella prima formula dà $(n-1)/nsigma^2$, la seconda formula è la varianza campionaria corretta ottenuta moltiplicando per l'inverso $n/(n-1)$ di modo che il risultato sia $sigma^2$ .

Rggb1

3 giu 2010, 08:49

Piccolo estratto dal mio vecchio (vecchissimo) libro delle superiori; il grassetto l'ho messo io.

"Se $X_1, X_2, ..., Xn$ denotano le v.c. di un campione di grandezza $n$, allora la v.c. che ci fornisce la varianza del campione o varianza campionaria è definita da

$S^2 = ((X_1-bar X)^2+(X_2-bar X)^2+...+(X_n-bar X)^2)/n$ (*)

Precedentemente abbiamo trovato che $E(bar X)=mu$ e sarebbe bello se avessimo anche $E(S^2)=sigma^2$. (sic, ndr)
Quando il valore probabile di un riassunto è uguale al corrispondente parametro della popolazione, diremo che il riassunto è uno stimatore corretto e il valore una stima corretta di questo parametro. Si verifica però che

$E(S^2) = mu_s^2 = (n-1)/n * sigma^2$

che è molto vicino a $sigma^2$ solo per grandi valori di $n$ (diciamo $n>=30$). Lo stimatore corretto che desideriamo sarà definito da
$hat S ^2 = n/(n-1)*S^2 = ((X_1-bar X)^2+(X_2-bar X)^2+...+(X_n-bar X)^2)/(n-1)$
così che
$E(hat S ^2) = sigma^2$
A causa di ciò, alcuni statistici definiscono la varianza campionaria mediante $hat S^2$ piuttosto che mediante $S^2$ e sostituiscono semplicemente $n$ con $n-1$ nel denominatore della (*). Noi tuttavia continueremo a definire la varianza campionaria con la (*) perché in questo modo molti risultati successivi verranno semplificati."

Notare la differenza di notazione e anche la giustificazione "in questo modo ci torna meglio"

Fioravante Patrone1

3 giu 2010, 14:55

Bello! Appunto, che cento fiori fioriscano (cit.

)

Rispondi

Per rispondere a questa discussione devi prima effettuare il login.

Problemi di terminologia

Segnala Post di

Aggiungi immagine

Aggiungi allegato

Aggiungi Link

Aggiungi formula matematica