P-value e significatività: banale x voi, un po' meno x me!
Salve gente, avrei bisogno di una conferma (o smentita) alla seguente questione:
sono alle prese con un esercizio di regressione lineare multipla piuttosto semplice.
Mi viene dato l'output di Analisi Dati di Excel dove compare il valore dell'intercetta e di 3 coefficienti di regressione relativi a 3 variabili, e ho i relativi p-value.
Uno di questi p-value è pari al 24% (diversamente dagli altri che si aggirano attorno allo 0,4% se non meno) e già questo mi indica che la variabile X3 a cui è associato quel p-value non è molto attendibile per spiegare il modello.
Alla fine dell'esercizio mi viene chiesto se l'intervallo di confidenza per il coefficiente di X3 potrebbe essere coerente con un risultato numerico di questo tipo:
Pr(0,013
Se sì perchè o se no perchè?
Io sarei tentata di dire che non è coerente in quanto il livello di significatività dell'intervallo di confidenza è 5%, che è minore del 24% del p-value associato, e pertanto non potendo rifiutare H0: b3=0, in tale intervallo di confidenza dovrebbe essere compreso anche il valore 0.
Qualcuno mi conferma che il ragionamento sia esatto?
Grazie mille.
P.S. non accanitevi contro di me per la banalità della questione... studio economia!
sono alle prese con un esercizio di regressione lineare multipla piuttosto semplice.
Mi viene dato l'output di Analisi Dati di Excel dove compare il valore dell'intercetta e di 3 coefficienti di regressione relativi a 3 variabili, e ho i relativi p-value.
Uno di questi p-value è pari al 24% (diversamente dagli altri che si aggirano attorno allo 0,4% se non meno) e già questo mi indica che la variabile X3 a cui è associato quel p-value non è molto attendibile per spiegare il modello.
Alla fine dell'esercizio mi viene chiesto se l'intervallo di confidenza per il coefficiente di X3 potrebbe essere coerente con un risultato numerico di questo tipo:
Pr(0,013
Io sarei tentata di dire che non è coerente in quanto il livello di significatività dell'intervallo di confidenza è 5%, che è minore del 24% del p-value associato, e pertanto non potendo rifiutare H0: b3=0, in tale intervallo di confidenza dovrebbe essere compreso anche il valore 0.
Qualcuno mi conferma che il ragionamento sia esatto?
Grazie mille.
P.S. non accanitevi contro di me per la banalità della questione... studio economia!

Risposte
Stai tranquilla è corretto, ovvero:
se il p-value è $0,24$ vuol dire che non possiamo rifiutare l'ipotesi nulla $b3=0$ con un test al $5%$.
Ne consegue che se si costruisce l'intervallo di confidenza al 95% il valore $0$ deve essere compreso in tale intervallo, quindi come tu dici, l'intervallo indicato è incoerente con i risultati del test.
Se ti può essere d'aiuto si può dire che se imposti un intervallo di confidenza al $76%$ (il complementare del p_value), uno dei due estremi dell' intervallo ottenuto coincide con $0$ (e più in generale con il valore impostato per la nulla), per sapere se si tratta dell'estremo destro o sinistro dobbiamo conoscere il valore stimato
se il p-value è $0,24$ vuol dire che non possiamo rifiutare l'ipotesi nulla $b3=0$ con un test al $5%$.
Ne consegue che se si costruisce l'intervallo di confidenza al 95% il valore $0$ deve essere compreso in tale intervallo, quindi come tu dici, l'intervallo indicato è incoerente con i risultati del test.
Se ti può essere d'aiuto si può dire che se imposti un intervallo di confidenza al $76%$ (il complementare del p_value), uno dei due estremi dell' intervallo ottenuto coincide con $0$ (e più in generale con il valore impostato per la nulla), per sapere se si tratta dell'estremo destro o sinistro dobbiamo conoscere il valore stimato