Approssimazione normale e con Chebyshev
Ciao a tutti, potreste dirmi se vi tornano i miei risultati?
Siano [tex]X_1,...,X_{1000}[/tex] v.a. iid con distribuzione di Bernoulli di parametro 1/250 e S la loro somma.
Dare una stima del minimo n per cui [tex]P(S\le n)\ge 0.99[/tex].
[tex]E(X_i) = 1/250, Var(X_i) = 249/250^2 \simeq 1/250, E(S) =4, Var(S) = 4*249/250 \simeq 4[/tex]
App. normale
Si ha [tex]P(S \le n) = P(\frac{S - 4}{2} \le \frac{n-4}{2}) \simeq \Phi(\frac{n-4}{2}) \ge 0.99[/tex] sse [tex]\frac{n-4}{2} \ge 2.325[/tex] da cui [tex]n \ge 8.65[/tex], ovvero il minimo n è 9.
App. con la disuguaglianza di Chebyshev
[tex]P(S \le n) = P(|S- E(S)| \le n - E(S))[/tex] (poichè [tex]n \ge E(S)[/tex]) e quindi si deve avere [tex]P(|S -E(S)| \ge n+1-E(S))\le 1-0.99= 0.01[/tex], che, usando Chebyshev, è vera se [tex]\frac{Var(S)}{(n+1-E(S))^2} \le 0.01 \iff n \ge 23[/tex].
grazie in anticipo
Edit: avevo sbagliato a scrivere il parametro della distribuzione
[tex][/tex]
Siano [tex]X_1,...,X_{1000}[/tex] v.a. iid con distribuzione di Bernoulli di parametro 1/250 e S la loro somma.
Dare una stima del minimo n per cui [tex]P(S\le n)\ge 0.99[/tex].
[tex]E(X_i) = 1/250, Var(X_i) = 249/250^2 \simeq 1/250, E(S) =4, Var(S) = 4*249/250 \simeq 4[/tex]
App. normale
Si ha [tex]P(S \le n) = P(\frac{S - 4}{2} \le \frac{n-4}{2}) \simeq \Phi(\frac{n-4}{2}) \ge 0.99[/tex] sse [tex]\frac{n-4}{2} \ge 2.325[/tex] da cui [tex]n \ge 8.65[/tex], ovvero il minimo n è 9.
App. con la disuguaglianza di Chebyshev
[tex]P(S \le n) = P(|S- E(S)| \le n - E(S))[/tex] (poichè [tex]n \ge E(S)[/tex]) e quindi si deve avere [tex]P(|S -E(S)| \ge n+1-E(S))\le 1-0.99= 0.01[/tex], che, usando Chebyshev, è vera se [tex]\frac{Var(S)}{(n+1-E(S))^2} \le 0.01 \iff n \ge 23[/tex].
grazie in anticipo
Edit: avevo sbagliato a scrivere il parametro della distribuzione
[tex][/tex]
Risposte
Prima di dirti com'è la soluzione (che vedrai in spoiler) vorrei fare alcune premesse
1) la disuguaglianza di Cebicev è del tutto inutile (e soprattutto fornisce risultati del tutto inutilizzabili) se si conosce la distribuzione della popolazione....quindi è corretto procedere con la stima della probabilità richiesta tramite il teorema del limite centrale.
2) tu hai 1000 distribuzioni che possono valere (in modo equiprobabile) 0 oppure 1 e le sommi.....avrai quindi una sequenza di questo tipo
0001010101011110001110101000111010101011111000001111
dove "grosso modo" gli zeri e gli uni si equivalgono in numerosità....ed affermi che con probabilità $>=99%$ la somma è minore di 9?????
La formula che hai utilizzato va bene ma hai sbagliato a calcolare media e varianza di S
$E(S)=n*p=1000/2=500$
$V(S)=1000*1/2 * 1/2=250$
1) la disuguaglianza di Cebicev è del tutto inutile (e soprattutto fornisce risultati del tutto inutilizzabili) se si conosce la distribuzione della popolazione....quindi è corretto procedere con la stima della probabilità richiesta tramite il teorema del limite centrale.
2) tu hai 1000 distribuzioni che possono valere (in modo equiprobabile) 0 oppure 1 e le sommi.....avrai quindi una sequenza di questo tipo
0001010101011110001110101000111010101011111000001111
dove "grosso modo" gli zeri e gli uni si equivalgono in numerosità....ed affermi che con probabilità $>=99%$ la somma è minore di 9?????
La formula che hai utilizzato va bene ma hai sbagliato a calcolare media e varianza di S
$E(S)=n*p=1000/2=500$
$V(S)=1000*1/2 * 1/2=250$
Scusa, avevo sbagliato. Ti sembra corretto se le [tex][/tex] sono Be(1/250)?
...e io come un piXXa mi chiedevo che tipo di calcoli avessi fatto.....
sì sì così va bene....anche utilizzando la correzione per continuità viene sempre $n=9$
ovviamente a questo punto tutto ciò che ti ho scritto diventa superfluo, tranne l'osservazione sull'inutilità della disuguaglianza di Cebicev[nota]$P(S<=23)~~99.9999999992%~~100%$[/nota]
però a questo punto è anche inutile l'esercizio e mi chiedo che senso abbia la richiesta di stimare il minimo valore di $n$ quando si calcola subito il suo valore esatto:
$P(S<=8)~~97.89%$
$P(S<=9)~~99.20%$
quindi il minimo è $n=9$
sì sì così va bene....anche utilizzando la correzione per continuità viene sempre $n=9$
ovviamente a questo punto tutto ciò che ti ho scritto diventa superfluo, tranne l'osservazione sull'inutilità della disuguaglianza di Cebicev[nota]$P(S<=23)~~99.9999999992%~~100%$[/nota]
però a questo punto è anche inutile l'esercizio e mi chiedo che senso abbia la richiesta di stimare il minimo valore di $n$ quando si calcola subito il suo valore esatto:
$P(S<=8)~~97.89%$
$P(S<=9)~~99.20%$
quindi il minimo è $n=9$
Credo fosse per comparare i diversi tipi di approssimazione col valore corretto, infatti richiedeva anche di approssimare con la legge dei piccoli numeri.
Grazie ancora
Grazie ancora