Varianza - crocetta e giustifica la risposta
Sia $X$ una variabile aleatoria discreta con la seguente funzione di massa di probabilità:
se $x=0$ allora $p(x)=0.5$
se $x=1$ allora $p(x)=0.3$
se $x=2$ allora $p(x)=0.2$
Sapendo che $E(X) = 0,7$
Dire se la varianza di $X$ è
$a) E(X^2) - [E(X)]^2 = 0,61$
$b) 1/(n-1) sum_i^3 (x_i - E(x))^2= (2,27)/2 = 1,135 $
$c) 1/n sum_i^3 (x_i - E(x))^2 = (2,27)/3 = 0,756$
La risposta corretta è la $a)$.
Sapreste dirmi perché le risposte $b$ e $c$ sono sbagliate?
se $x=0$ allora $p(x)=0.5$
se $x=1$ allora $p(x)=0.3$
se $x=2$ allora $p(x)=0.2$
DOMANDA
Sapendo che $E(X) = 0,7$
Dire se la varianza di $X$ è
$a) E(X^2) - [E(X)]^2 = 0,61$
$b) 1/(n-1) sum_i^3 (x_i - E(x))^2= (2,27)/2 = 1,135 $
$c) 1/n sum_i^3 (x_i - E(x))^2 = (2,27)/3 = 0,756$
La risposta corretta è la $a)$.
Sapreste dirmi perché le risposte $b$ e $c$ sono sbagliate?
Risposte
"anonymous_58f0ac":
Sapreste dirmi perché le risposte $b$ e $c$ sono sbagliate?
Tanto per cominciare, perché i tre valori hanno probabilità diverse. E $n$ cosa sarebbe?
"Sergio":
[quote="anonymous_58f0ac"]Sapreste dirmi perché le risposte $b$ e $c$ sono sbagliate?
"Perché non c'entrano nulla" va bene come risposta?
La a) è la definizione della varianza di una variabile aleatoria, le altre si usano quando le $x_i$ sono variabili aleatorie indipendenti e identicamente distribuite, non i possibili valori di una variabile aleatoria.
La a) è equivalente a \(E(x_i-E(x))^2=\sum_{i=1}^3(x_i-0.7)^2p_i\), ovvero i singoli scarti vengono pesati con le loro probabilità. In b) e c) il peso viene approssimato dalla frequenza con cui i valori possono presentarsi. Esempio (un po' rozzo, ma spero renda l'idea):
> x <- c(rep(0,15),rep(1,9),rep(2,6)); x [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 > sum(x == 0)/30 [1] 0.5 > sum(x == 1)/30 [1] 0.3 > sum(x == 2)/30 [1] 0.2 > x_mean <- mean(x); x_mean [1] 0.7 > sum((x-x_mean)^2)/30 [1] 0.61[/quote]
Gentilissimo e chiaro come sempre Sergio! Grazie!
"Sergio":
[quote="anonymous_58f0ac"]Sapreste dirmi perché le risposte $b$ e $c$ sono sbagliate?
"Perché non c'entrano nulla" va bene come risposta?
La a) è la definizione della varianza di una variabile aleatoria, le altre si usano quando le $x_i$ sono variabili aleatorie indipendenti e identicamente distribuite, non i possibili valori di una variabile aleatoria.
[/quote]
$x=0$, $x=1$ e $x=2$ sono semplicemente i valori che LA variabile aleatoria può assumere.
Come hai detto tu, avrebbe avuto senso usare la $b$ e la $c$ in caso di variabili aleatorie i.i.d, ovvero se avessi avuto diverse variabili aleatorie, ognuna delle quali poteva assumere $n$ valori diversi, tutti con uguali probabilità.