Intervalli di confidenza
Si è interessati a stimare la proporzione $\pi$ di clienti di un supermercato interessati all’acquisto dei prodotti della fascia "primo prezzo”.
A tal fine si seleziona un campione di 500 clienti e si rilevano le loro opinioni in merito a questa categoria di prodotti. Di questi, 407 si dichiarano interessati all’acquisto.
Si determini l’intervallo di confidenza del 96% per la proporzione $\pi $ della popolazione.
[size=85](Si tenga conto del teorema del limite centrale e che alcuni quantili della distribuzione Normale standardizzata Z sono i seguenti:
z0.949 =1.638, z0.955 =1.695, z0.965 = 1.812, z0.975=1.96, z0.98=2.055, z0.99=2.326, z0.995=2.576)[/size]
--------------------------------------------------------------------------------------------------------------------------------------
E qui, mi dispiace ammetterlo, non so proprio da dove partire: non viene dichiarato il valore della varianza, tuttavia non posso utilizzare T di student perché nel testo dell'esercizio vengono forniti i quantili della distribuzione Normale...
A tal fine si seleziona un campione di 500 clienti e si rilevano le loro opinioni in merito a questa categoria di prodotti. Di questi, 407 si dichiarano interessati all’acquisto.
Si determini l’intervallo di confidenza del 96% per la proporzione $\pi $ della popolazione.
[size=85](Si tenga conto del teorema del limite centrale e che alcuni quantili della distribuzione Normale standardizzata Z sono i seguenti:
z0.949 =1.638, z0.955 =1.695, z0.965 = 1.812, z0.975=1.96, z0.98=2.055, z0.99=2.326, z0.995=2.576)[/size]
--------------------------------------------------------------------------------------------------------------------------------------
E qui, mi dispiace ammetterlo, non so proprio da dove partire: non viene dichiarato il valore della varianza, tuttavia non posso utilizzare T di student perché nel testo dell'esercizio vengono forniti i quantili della distribuzione Normale...

Risposte
Scusami, ma io sapevo che i test di ipotesi erano un'altra cosa 
Detto questo, il campione è generato da una bernoulliana e quindi la varianza la conosci eccome!

Detto questo, il campione è generato da una bernoulliana e quindi la varianza la conosci eccome!
Indubbiamente, tuttavia si può vedere facilmente anche la varianza della popolazione stimando il parametro della Bernoulli con la media campionaria
Molto velocemente.. Dato che il campione è estratto da bernoulliane iid $Bern(p)$, si stima $p$ con la media campionaria $\hat P$ e la varianza è $\hat P(1-\hat P)$.
Per il campione (grande) la quantità pivotale è $\frac{\hat P - p}{\sqrt{\frac{p(1-p)}{n}}}$ e stimi la deviazione standard di $\hat P$ con $\sqrt{\frac{\hat P(1-\hat P)}{n}}$. Detto questo si hanno tutti gli ingredienti per calcolare l'intervallo di confidenza
Per il campione (grande) la quantità pivotale è $\frac{\hat P - p}{\sqrt{\frac{p(1-p)}{n}}}$ e stimi la deviazione standard di $\hat P$ con $\sqrt{\frac{\hat P(1-\hat P)}{n}}$. Detto questo si hanno tutti gli ingredienti per calcolare l'intervallo di confidenza
"Cronovirus":
Molto velocemente.. Dato che il campione è estratto da bernoulliane iid $Bern(p)$, si stima $p$ con la media campionaria $\hat P$ e la varianza è $\hat P(1-\hat P)$.
Per il campione (grande) la quantità pivotale è $\frac{\hat P - p}{\sqrt{\frac{p(1-p)}{n}}}$ e stimi la deviazione standard di $\hat P$ con $\sqrt{\frac{\hat P(1-\hat P)}{n}}$. Detto questo si hanno tutti gli ingredienti per calcolare l'intervallo di confidenza
Avevo pensato anche io ad una dstribuzione di Bernoulli, ma non sapevo che dati utilizzare, ma allora come inserivici anche la Normale?!? Ho una tale confusione......

"frons79":
[quote="Cronovirus"]Molto velocemente.. Dato che il campione è estratto da bernoulliane iid $Bern(p)$, si stima $p$ con la media campionaria $\hat P$ e la varianza è $\hat P(1-\hat P)$.
Per il campione (grande) la quantità pivotale è $\frac{\hat P - p}{\sqrt{\frac{p(1-p)}{n}}}$ e stimi la deviazione standard di $\hat P$ con $\sqrt{\frac{\hat P(1-\hat P)}{n}}$. Detto questo si hanno tutti gli ingredienti per calcolare l'intervallo di confidenza
Avevo pensato anche io ad una dstribuzione di Bernoulli, ma non sapevo che dati utilizzare, ma allora come inserivici anche la Normale?!? Ho una tale confusione......

Eh ho visto

$$ -z_\alpha < \frac{\hat P - p}{\sqrt{\frac{\hat p(1-\hat p)}{n}}} < z_\alpha$$
e ottieni che intervallo di confidenza è
$$(\hat P - \frac{z_\alpha}{\sqrt{n}}\sqrt{\hat P (1-\hat P)}, \hat P + \frac{z_\alpha}{\sqrt{n}}\sqrt{\hat P (1-\hat P)}) $$
...per essere preciso ho sbagliato non definendo da nessuna parte $\alpha$

grazie 1000
Se c'è qualcosa che non è chiaro chiedi pure
Personalmente non mi piace la scrittura $z_{1-\alpha/2}$, preferisco la notazione $z_{\alpha/2}$ in modo tale da richiedere che il parametro sia nell'intervallo con probabilità $1-\alpha$, ma vabbè: notazione

Personalmente non mi piace la scrittura $z_{1-\alpha/2}$, preferisco la notazione $z_{\alpha/2}$ in modo tale da richiedere che il parametro sia nell'intervallo con probabilità $1-\alpha$, ma vabbè: notazione

"Cronovirus":
Se c'è qualcosa che non è chiaro chiedi pure
Siccome non mi era mai capitato prima un esercizio sugli intervalli di confidenza con distribuzioni di Bernoulli, non ho ben chiaro il modo di procedere, passo-passo.
In pratica, quello che so (dalla teoria) è che:
$p(X\approx B (\Pi))=\Pi^x (1- \Pi)^{1-x}$
$\mathbb{E}(X)= \Pi$
$VAR(X)=\Pi(1-\Pi)$
e dal testo dell'esercizio che la numerosità del campione (n)=500.
Adesso mi manca di conoscere il successo e l'insuccesso di questa distribuzione: io ho pensato che siccome sul totale del campione (500) una buona parte è per l'acquisto (407), dò per scontato che la restante parte non lo sia (500-407=93).
Quindi ho pensato che $\text{successo}(x)=\frac{407}{500}=0.814$, $\text{insuccesso}(1-x)= 1-0.814=0.186$.
Poi ho trovato gli estremi di $Z_{1-\frac{\alpha}{2}}: [-2.055;2.055]$.
Ma come stimo $\Pi$, in pratica?
Se leggi i post precedenti trovi già la risposta: media campionaria
"Cronovirus":
Se leggi i post precedenti trovi già la risposta: media campionaria
Vorrei chiarire un attimo su questo passaggio... in pratica essa corrisponde alla probabilità di Successo (x)?

Ti consiglio di dare una bella occhiata alla statistica inferenziale e in particolare agli stimatori. Mi rendo conto che il passaggio da statistica descrittiva a inferenziale è complicato, ma è necessario per capire il senso di tutto..
Io come formula per la stima della media avrei, nel caso non si conosca la varianza:
\[
-Z_{1-\frac{\alpha}{2}} \le \frac{\bar{x}-\mu}{\frac{\hat{s}}{n}} \le Z_{1-\frac{\alpha}{2}}
\]
dove $\hat{s}$ è la radice della varianza campionaria corretta. Questa disequazione va poi risolta in funzione di $\mu$.
E' corretto?
\[
-Z_{1-\frac{\alpha}{2}} \le \frac{\bar{x}-\mu}{\frac{\hat{s}}{n}} \le Z_{1-\frac{\alpha}{2}}
\]
dove $\hat{s}$ è la radice della varianza campionaria corretta. Questa disequazione va poi risolta in funzione di $\mu$.
E' corretto?
Direi che non è corretto quello che dici:
1)
\[
-Z_{1-\frac{\alpha}{2}} \le \frac{\bar{x}-\mu}{\frac{\hat{s}}{\sqrt n}} \le Z_{1-\frac{\alpha}{2}}
\]
Non è una stima della media: garantisci con una certa probabilità che la media sia in un intervallo.
2) Ti manca la radice quadrata su $n$. Per il resto sì: nel caso non conoscessi la varianza della popolazione puoi usare la formula che hai scritto
1)
\[
-Z_{1-\frac{\alpha}{2}} \le \frac{\bar{x}-\mu}{\frac{\hat{s}}{\sqrt n}} \le Z_{1-\frac{\alpha}{2}}
\]
Non è una stima della media: garantisci con una certa probabilità che la media sia in un intervallo.
2) Ti manca la radice quadrata su $n$. Per il resto sì: nel caso non conoscessi la varianza della popolazione puoi usare la formula che hai scritto