HELP! Determinazione numerosità campionaria

gabrielcampeau
Mi sto preparando per l'esame di statistica! Chi mi vuole o mi può aiutare a risolvere questo problema? Non so neanche da dove cominciare!

Un’agenzia che si occupa di sondaggi deve prevedere i risultati delle prossime elezioni regionali. Qual `e la dimensione n del campione dei potenziali elettori da intervistare affinch ́e sia solo dell’1% la probabilit`a di osservare una percentuale di votanti per il candidato Alfa inferiore al 50% quando in effetti essa `e del 52%.

Vi prego!

Grazie

Gabriel

Risposte
momo16
Il problema ti sta chiedendo quante estrazioni ti servono (suppongo con reinserimento) affinchè $P(|Xn-mu|<0.02)=0.99$.
(cioè un eventuale cambiamento del 2% nel risultato del sondaggio non voglia dire nulla).
Usando il teorema centrale del limite puoi arrivare a determinare la tua n

bassi0902
Io comincerei definendo un campione di ampiezza $n$ a cui verrá effettuato il sondaggio. Puoi modellizzare i risultati del sondaggio con una variabile aleatoria $Y$ che indica il numero di persone che ha votato il candidato Alfa.
In questo modo, sapendo che la percentuale reale di votanti per Alfa é 52%, puoi dire che $Y ~ B\text{in}(n, p=0.52)$.

Quando il campione é sufficientemente grande (solitamente si dice $n > 30$, in questo caso é ampiamente piú grande di 30) si puó approssimare la distribuzione binomiale con la distribuzione normale con media e varianza pari ai rispettivi valori della variabile binomiale, ovvero $E[Y] = np \ , \ Var[Y]=np(1-p) $.

$$ Y \sim Bin(n, p) \sim \sim N(np, np(1-p)) $$

L'esercizio richiede di trovare $n$ affinché $$ P(Y/n < 0.5) \le 0.01 $$
dove $Y/n$ rappresenta la percentuale osservata di votanti per Alfa, proseguendo i calcoli si ottiene:

$$ P(Y/n < 0.5) = P(Y < 0.5n) = P\left( \frac{Y-np}{\sqrt{np(1-p)}} < \frac{0.5n - np}{\sqrt{np(1-p)}}\right) = P\left(Z < \frac{n(0.5-p)}{\sqrt{np(1-p)}}\right) = \Phi\left(\frac{n(0.5-p)}{\sqrt{np(1-p)}}\right)$$

Dove $Z$ rappresenta la v.a. gaussiana standard.

Vogliamo trovare $n$ tale che questa probabilitá sia uguale all'1%, per fare ció dobbiamo eguagliare la quantitá $\frac{n(0.5-p)}{\sqrt{np(1-p)}}$ al quantile di ordine 0.01.

$$ \frac{n(0.5-p)}{\sqrt{np(1-p)}} = z_{0.01} \approxeq -2.33 $$
Risolvendo per $n$, dopo aver sostituito a $p$ il valore vero di 0.52 si ottiene $n \ge 3388$

gabrielcampeau
Grazie mille per le informazioni!

Gabriel

momo16
Così è come lo avrei risolto io, interpretando il problema in maniera un po' differente. Ho considerato la varianza minimizzata e il fatto di non conoscere a priori qual è la percentuale di votanti per il candidato nella popolazione (cosa che mi sembrava più sensata). Aspetto altri pareri per vedere se la mia risposta è ragionevole o meno.

$P(|Xn-mu|<\epsilon)=1-alpha$
$P((|Xn-mu|)/(\sqrt{(\sigma^2)/n)}<\epsilon/(\sqrt{(\sigma^2)/n)})=P(|Zn|<\epsilon/(\sqrt{(\sigma^2)/n)})$
Per il TCL si ha che possiamo approssimare $Zn$ con $Z$ per $n$ grande, quindi:
$=P(-\epsilon/(\sqrt{(\sigma^2)/n)} =2phi(\epsilon/(\sqrt{(\sigma^2)/n)})-1$ (per note proprietà della Normale)

Cioè:
$P(|Xn-mu|<\epsilon)=1-alpha=2phi(\epsilon/(\sqrt{(\sigma^2)/n)})-1$
$phi(\epsilon/(\sqrt{(\sigma^2)/n)})=1-alpha/2$
$\epsilon/(\sqrt{(\sigma^2)/n)}=phi^-1(1-alpha/2)$
Ovvero è uguale al quantile di ordine $1-alpha/2$ (nel nostro caso quindi $0.995$, con $alpha=0.01$)
Supponiamo la varianza minima, ovvero $1/4$

Nel nostro caso quindi:
$\epsilon=0.02$
$0.02=2.58/(2\sqrt{n})$

bassi0902
"momo1":
Ho considerato la varianza minimizzata e il fatto di non conoscere a priori qual è la percentuale di votanti per il candidato nella popolazione (cosa che mi sembrava più sensata).


Il ragionamento fila, il fatto é che Il testo dice esplicitamente che la percentuale dei votanti vera é 52%, perché l'hai assunta ignota?

momo16
"bassi0902":
[quote="momo1"] Ho considerato la varianza minimizzata e il fatto di non conoscere a priori qual è la percentuale di votanti per il candidato nella popolazione (cosa che mi sembrava più sensata).


Il ragionamento fila, il fatto é che Il testo dice esplicitamente che la percentuale dei votanti vera é 52%, perché l'hai assunta ignota?[/quote]

Perchè avevo interpretato male il problema: pensavo che ".... percentuale di votanti per il candidato Alfa inferiore al 50% quando in effetti essa `e del 52%." fosse un giro di parole per dire "l'intervallo di confidenza deve essere del 2%", quando, in realtà. è un dato di fatto e quindi hai già media e varianza della tua $Zn$.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.