Econometria significatività test F test t

Denni1
Non riesco a svolgere un esercizio data una tabella di dati che trovate a questa pagina:

Si consideri il modello di regressione in cui si vuole analizzare se la numerosità di crimini violenti(ogni 100.000 persone) (crime) dipende dalla percentuale di persone che abitano in grossi centri abitati(pctmetro) dalla percentuale di persone che vivono in condizioni di povertà (poverty) e dalla percentuale di soggetti che sono genitori single(single). i risultati del modello stimato su 51 aree geografiche sono riportate qui di seguito:

http://cl1p.net/econometria/

devo commentare la significatività dei parametri del modello considerato il test F e le statistiche test t

Devo prepararlo per lunedi da oggi, mi sono messo sotto per risolverlo ma ho confusione in testa...se qualcuno sa come risolverlo o darmi qualche dritta su come iniziarlo visto che devo fornire anche la spiegazione di passaggio per passaggio gli sono grato...io torno a lavorarci su adesso..
grazie di tutto...ciao!!

Risposte
olaxgabry
Ciao.
Incominciamo dal test t sui singoli parametri. Qui puoi procedere in vari modi:

Primo modo: osserva il p-value (P>|t|) e vedi la significatività del parametro ad un livello di significatività del 5% o 1% (dipende anche dal testo e da cosa ti chiede). Comunque ricordati che il p-value è il più piccolo livello di significatività per il quale rifiuti l'ipotesi nulla che il coefficiente sia nullo. Prendi il regressore Pctmetro, io direi che il coefficiente corrispondente è significativamente diverso da zero (rifiuti l'ipotesi nulla), concordi?

Secondo modo: osserva l'intervallo di confidenza al 95%, ovvero quando il livello di significatività che usi è pari al 5%. Se il valore 0 è compreso nell'intervallo allora accetti l'ipotesi nulla altrimenti no. Qui però lavori solo con un livello del 5%. Osserva il regressore Pctmetro, anche qui è abbastanza semplice osservare che l'ipotesi nulla è rifiutata.

Per gli altri ragionaci tu e fammi sapere. Poi passiamo al test F.

Ciao

Denni1
allora vediamo se ho capito almeno il primo modo:
sinceramente forse è proprio come avevo pensato io allora, sempre se veramente è giusto quel che pensavo io, io pensavo che con il metodo del P-value tutti i parametri rifiutano l'ipotesi nulla..in quanto nessuno dei 3 valori è compreso nel intervallo del 95% ... però questo tu lo descrivi come secondo metodo ovvero quello del test t... mentre invece da quanto avevo capito dai miei appunti il valore campionario della statistica t devo confrontarlo con + o - 1,96 ovvero l'alfa approssimato alla normale...no?

olaxgabry
Il p-value e l'intervallo di confidenza al 95% sono due cose diverse. Nel primo tu studi il test per un generico livello di significatività, nel secondo invece solo per un livello pari al 5%. Nel tuo esempio tutti i parametri sono significativi ad un livello del 5% e credo che tu debba fare riferimento solo a questo: ciò è evidente dal p value (sempre minore del 5%) e anche dagli intervalli di confidenza.
Osserva che per il regressore Poverty accetteresti l'ipotesi nulla per un livello di significatività dell'1%.

Denni1
mi sa che sto facendo una grande confusione.
allora spiegando passo per passo nel metodo degli intervalli di confidenza quindi al 5% di intervallo di significatività io devo confrontare il valore che sta in P>|t| e vedere se sta nell intervallo dato giusto( e quell intervallo si calcola per esempio nel caso del pctmetro facendo: 7.828935+-1,96x1,254699 che poi sono i valori dati nella tabella sotto il 95% conf interval)..è giusto cosi? in questo caso quindi nessuno di quei dati sta nei rispettivi intervalli e quindi non accetto nessuna ipotesi nulla dei parametri.
però continuo a non capire la parte del p-value...riesci a farmi un esempio numerico per il caso del pctmetro che è quello che rifiuto e il caso poverty che è quello che accetto? cioè non capisco i valori da dove saltino fuori..

Denni1
ho aggiornato il primo post mettendo il testo dell'esercizio comunque per sicurezza.

poi ragionando su quello che hai detto ho pensato che il p.value dipende dalla statistica t giusto?
quindi se alfa=1% il p-value è di -2,58 + 2,58 e quindi l unico valore che ci sta dentro è quello del parametro poverty mentre gli altri parametri hanno valori di t che stanno fuori da quell'intervallo e quindi non possono esserre accettati per cui sia nel caso del 1% sia nel caso del 5% i paramtri pctmetro e single rifiutano l'ipotesi nulla giusto? mentre il parametro poverty l'accetta solo per un livello di significatività pari al 1% ma la rifiuta per un livello di significatività al 5% giusto ? mentre come detto prima invece con il sistema della stima degli intervalli al 95% tutti rifiutano l'ipotesi..è giusto cosi?

SnakePlinsky
premetto che non ho visto i dati (potresti postarli, indicando la fonte, metodo con cui sono ottenuti, che campione rappresentano etc. ? thx), ma la regressione sembra molto buona e tutti i coeff sono significativi

parti così per descrivere i risultati:

-bontà del fitting (R2) > dell'80%
-tutti i coeff. sono significativi (p value è < di 0.01 in 2 casi su tre, < 5% nel rimanente caso)

t è il rapporto fra coeff. ed errore standard. questo rapporto ha una distribuzione particolare, cmq a livello di thumb rule considera che maggiore è in valore ass. maggiore è probabile che il tuo coeff. sia significativo. il pvalue infine ti dice dove si situa tale valore nella distribuzione, ovvero qual'è la probabilità di incontrare valori del coef. maggiori di quello ottenuto... < è meglio è

mi incuriosisce la fonte dei dati, fammi sapere di più ... poi le % sono espresse in termini assoluti o % ?

Denni1
Non capisco se voi due abbiate detto la stessa cosa o meno perchè in realtà sembra diverso quello che dite o almeno il risultato finale...
cmq i dati sono solo quelli...ho postato sia il testo dell'esercizio sia la tabella..non ci sono altri dati nell esercizio..

ok cmq andando avanti ho capito il valore del test F come si calcola (nell'esercizio è già dato ma alla prof devo spiegar da dove arriva) il punto è che il test F per vedere se il paramentro è significativo devo confrontarlo con il valore critico sulla coda di destra di una distribuzione F (ovvero il dato Fv) ma non riesco a farlo perchè non capisco come calcolare questo valore quindi se non lo ho come posso fare il confronto e vedere se F>Fv e quindi accettare l'ipotesi?

Denni1
allora se ho capito continuando a ragionarci su la soluzione per il test t è questa:

se considero alfa= 0,01 allora :
per il parametro pctmetro t>talfa/2(50) ovvero ricorrendo alla tabella standardizzata 6,24>2,67 quindi rifiuto l'ipotesi
per il parametro poverty t per il paramentro single t > talfa/2(50) ovvero ricorrendo alla tabella standardizzata 8,541>2,67 quindi rifiuto l'ipotesi nulla

se considero alfa = 0,05 invece tutti i t sono > di talfa/2(50) quindi rifiuto l'ipotesi nulla per tutti e 3 i parametri

per quanto riguarda invece la stima intervallare beh si vede che per tutti e tre i parametri nessuno comprende il p|t| fra i loro valori per cui rifiuto l'ipotesi nulla per tutti i valori.
Per cui l'unico parametro a significatività del 1% per cui accetto l'ipotesi nulla è poverty

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.