Esercizio econometria - calcolo pvalue

Millina2
Ciao a tutti
volevo chiedervi aiuto su un esercizio di econometria da cui non riesco ad uscire!
Sostanzialmente gira intorno al calcolo del pvalue (e statistica t) in cui però non so che dati utilizzare!
Qualcuno riuscirà a darmi una mano? Spero di si! :-D

Senza riportare il testo per esteso i dati essenziali sono:
n=400
215 votanti per candidato uscente (p)
185 votanti per candidato sfidante (p^)

a) si richiede la stima di p
io ho fatto: 215/400=0,5375

b) si usi lo stimatore della varianza $ p^,p^(1-p^)/n $ per calcolare l'errore standard dello stimatore
io ho calcolato 0,5375(1-0,5375)/400, il risultato sotto radice =0,0249

c) qual è il valore-p per H0: p=0,5 contro H1:p diverso 0,5
il pvalue si calcola con la formula 2ϕ(-|t osservata|), dove t oss=(- |(Yoss -μ)/SE(Y)) che si distribuisce come una normale standardizzata. Ok, questo in teoria, ma nella pratica nel mio caso non capisco quale sia il valore osservato con cui calcolare il pvalue..

d) qual è il valore-p per H0: p=0,5 contro H1:p>0,5
Qui in teoria il pvalue è l'area sottostante la densità normale alla destra del valore osservato della statistica t (quindi non in valore assoluto), ma anche qui non so come calcolare il pvalue..

e) Perchè i due risultati precedenti differiscono
Dipende dall'ipotesi alternativa, immagino. Mentre la prima è diversa da 0,5 (e quindi si considera il valore assoluto della statistica t) il secondo è maggiore di 0,5 e quindi tiene conto solo dell'area destra della funzione di densità della normale.

f) L'indagine mostra una evidenza statisticamente rilevante del fatto che il candidato uscente è in testa al tempo dell'indagine? Perchè?
Io su questa risposta potrei basarmi sui dati iniziali (215 votano per l'uscente, 185 per lo sfidante) ma è realmente così?

g-h) Costruire l'intervallo di confidenza al 95% e 99% per p.
In questo caso devo utilizzare 0,5375+-1,96x(0,0249)?

Risposte
cenzo1
"Millina":
c) qual è il valore-p per H0: p=0,5 contro H1:p diverso 0,5
il pvalue si calcola con la formula 2ϕ(-|t osservata|), dove t oss=(- |(Yoss -μ)/SE(Y)) che si distribuisce come una normale standardizzata. Ok, questo in teoria, ma nella pratica nel mio caso non capisco quale sia il valore osservato con cui calcolare il pvalue..

Nell'ipotesi $H_{0}:{p_0=0.5}$ hai $z_{oss}=(p-p_0)/sqrt((p_0*(1-p_0))/n)=(0.5375-0.5)/sqrt((0.5*(1-0.5))/400)$ (anche 400 è sotto radice, nel caso non si vedesse bene)

"Millina":
f) L'indagine mostra una evidenza statisticamente rilevante del fatto che il candidato uscente è in testa al tempo dell'indagine? Perchè?
Io su questa risposta potrei basarmi sui dati iniziali (215 votano per l'uscente, 185 per lo sfidante) ma è realmente così?

Questo dipenderà dal p-value che ti esce. Se p-value<0.05 allora c'è evidenza statisticamente significativa al livello di significatività 5%.

"Millina":
g-h) Costruire l'intervallo di confidenza al 95% e 99% per p.
In questo caso devo utilizzare 0,5375+-1,96x(0,0249)?

Giusto. Nel caso al 99% ovviamente devi cambiare quel $1.96$.

Ciao

Millina2
"cenzo":
[quote="Millina"]c) qual è il valore-p per H0: p=0,5 contro H1:p diverso 0,5
il pvalue si calcola con la formula 2ϕ(-|t osservata|), dove t oss=(- |(Yoss -μ)/SE(Y)) che si distribuisce come una normale standardizzata. Ok, questo in teoria, ma nella pratica nel mio caso non capisco quale sia il valore osservato con cui calcolare il pvalue..

Nell'ipotesi $H_{0}:{p_0=0.5}$ hai $z_{oss}=(p-p_0)/sqrt((p_0*(1-p_0))/n)=(0.5375-0.5)/sqrt((0.5*(1-0.5))/400)$ (anche 400 è sotto radice, nel caso non si vedesse bene)[/quote]

grazie mille per la risposta, gentilissimo e velocissimo!
quindi la media μ è il valore che mi viene dato nell'ipotesi nulla?
infatti non sapevo proprio quale valore usare per μ e per questo non riuscivo a fare i calcoli...

se ad esempio mi chiedessero H0: p=0,6 sarebbe z=(0.5375-0.6)/sqrt((0.6*(1-0.6))/400) ho capito bene?

cenzo1
Si, è come hai inteso. Ciao :-)

Millina2
"cenzo":
[quote="Millina"]f) L'indagine mostra una evidenza statisticamente rilevante del fatto che il candidato uscente è in testa al tempo dell'indagine? Perchè?
Io su questa risposta potrei basarmi sui dati iniziali (215 votano per l'uscente, 185 per lo sfidante) ma è realmente così?

Questo dipenderà dal p-value che ti esce. Se p-value<0.05 allora c'è evidenza statisticamente significativa al livello di significatività 5%.[/quote]

Un'altra cosa che mi sono dimenticata nel post precedente... Mi puoi spiegare brevemente il perchè dipende dal pvalue?

Nel senso che dai calcoli mi risulta che per H0: p=0,5 vs H1 p diverso 0,5 il pvalue sia 0,132 e per H0: p=0,5 vs H1: p>0,5 sia 0,066
io fisso alfa pari a 5% quindi rifiuto se pvalue<0,05.
In entrambi i casi accetto l'ipotesi nulla... ma che cosa vuol dire in pratica? che conclusioni ne posso trarre da ciò?

cenzo1
"Millina":
Mi puoi spiegare brevemente il perchè dipende dal pvalue?

Nel senso che dai calcoli mi risulta che per H0: p=0,5 vs H1 p diverso 0,5 il pvalue sia 0,132 e per H0: p=0,5 vs H1: p>0,5 sia 0,066
io fisso alfa pari a 5% quindi rifiuto se pvalue<0,05.
In entrambi i casi accetto l'ipotesi nulla... ma che cosa vuol dire in pratica? che conclusioni ne posso trarre da ciò?

Non puoi rifiutare l'ipotesi nulla che le preferenze per il primo candidato siano al 50%, al livello di significatività 5%.
Con i dati a disposizione (il campione esaminato) quindi non emerge una significativa differenza tra i due candidati.

Il risultato dell'indagine che dice 53,75% per il candiato A è da ritenere frutto della casualità del campionamento, e non è da attribuire ad una reale differenza nelle preferenze dell'intero elettorato (tutta la popolazione di interese).

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.