Panel data : xtlogit fe o re?
Buongiorno a tutti,
sto implementando delle regressioni con dati panel con stata. il modello è a variabile dipendente binaria, tuttavia se implemento una regressione xtogit con fixed effects molte osservazioni vengono scartate, cosa che invece se utilizzo il modello xtlogit random effects non succede. il perchè questo accade è chiaro: Stata scarta tutti gli elementi per cui il valore è sempre solo zero su tutti gli anni oppure sempre solo uno su tutti gli anni per il modello xtlogit fe.
Il test Hausman sembra anche essere "d'accordo" per la maggior parte delle regressioni sull'utilizzo del modello xtlogit random effects... ma è sensato condurre il test hausman confrontando i risultati di xtlogit re e xtlogit fe quando nell'ultima regressione diverse osservazioni sono state scartate (circa la metà....)?
la mia domanda è invece: che cosa faccio "concretamente", ovvero che modello è meglio scegliere per fare un utilizzo migliore dei miei dati e (idealmente) riuscire a comprendere comunque tutte le osservazioni? io tendenzialmente propenderei per xtlogit random effects, qualcuno mi consiglierebbe di fare altro?
grazie a tutti coloro che risponderanno!
sto implementando delle regressioni con dati panel con stata. il modello è a variabile dipendente binaria, tuttavia se implemento una regressione xtogit con fixed effects molte osservazioni vengono scartate, cosa che invece se utilizzo il modello xtlogit random effects non succede. il perchè questo accade è chiaro: Stata scarta tutti gli elementi per cui il valore è sempre solo zero su tutti gli anni oppure sempre solo uno su tutti gli anni per il modello xtlogit fe.
Il test Hausman sembra anche essere "d'accordo" per la maggior parte delle regressioni sull'utilizzo del modello xtlogit random effects... ma è sensato condurre il test hausman confrontando i risultati di xtlogit re e xtlogit fe quando nell'ultima regressione diverse osservazioni sono state scartate (circa la metà....)?
la mia domanda è invece: che cosa faccio "concretamente", ovvero che modello è meglio scegliere per fare un utilizzo migliore dei miei dati e (idealmente) riuscire a comprendere comunque tutte le osservazioni? io tendenzialmente propenderei per xtlogit random effects, qualcuno mi consiglierebbe di fare altro?
grazie a tutti coloro che risponderanno!
Risposte
invece per lo studio dell' endogeneità invece che approccio alternativo al test Hausman potrei utilizzare? sarebbe comunque possibile studiare l'endogeneità anche nel mio caso specifico?
ho provato diverse alternative con il mio dataset nell'ultimo giorno (xtlogit PA, xtlogit pooled e xtmelogit);
con i primi due comandi ho trovato dei risultati coerenti con quanto ottenuto anche da Cameron e Trivedi, cosi come anche con il comando xtmelogit. L'ultimo in particolare come risultati ha dato dei coefficienti in linea con quelli ottenuti con xtlogit RE in termini di ordine di grandezza e significato interpretativo (segni + e -), ma con errori standard minori rispetto a xtlogit RE.
xtlogit FE invece da degli errori standard molto più grandi e dei coefficienti che hanno anche meno senso da un punto di vista interpretativo, per cui fino ad ora sembra la soluzione peggiore. inoltre xtlogit FE mi porta a perdere un numero consistente di informazioni. hausman-taylor invece nel mio caso non è implementabile mediante Stata dato che il mio modello non possiede tutte le quattro categorie necessarie per la sua implementazione con questo software (endogenous + exogenous /time variant + time invariant).
l'ambito particolare per cui sto facendo i test è quello economico-finanziario, e purtroppo ho visto anche io che il mondo accademico sembra essere un pò diviso su quale possa essere il modello migliore da adottare in un caso come il mio...
ultimo aggiornamento: nella mattinata ho guardato un pò meglio i modelli mixed effects, in particolare anche Cameron e Trivedi, pag. 298.
Nel manuale di Stata o da autori come ad es. Schunck (2013) vengono presentati i modelli mixed effects come modelli più flessibili rispetto a FE o RE "puri"... ma Cameron e Trivedi (pag. 298) sottolineano che in realtà la terminologia "fixed effects" relativa ai coefficienti beta stimati con mixed effects è in realtà molto diversa dagli effetti fissi che sono considerati invece dal test hausman, e che se l'ultima tipologia di effetti fissi è presente nel modello ciò può rendere gli stimatori inconsistenti.
Quindi che cos'altro potrei tentare?
avendo compilato manualmente tutto il database xtlogit RE ha in effetti dato dei coefficienti che erano quelli che mi aspettavo per l'analisi che devo svolgere... propenderei per quella tipologia di modello, naturalmente spiegando nelle conclusioni e limitazioni del mio paper le tipologie di problematiche che sono sorte nell'implementazione dei modelli, sempre nel caso in cui in questi giorni non riesca a trovare una soluzione migliore...
con i primi due comandi ho trovato dei risultati coerenti con quanto ottenuto anche da Cameron e Trivedi, cosi come anche con il comando xtmelogit. L'ultimo in particolare come risultati ha dato dei coefficienti in linea con quelli ottenuti con xtlogit RE in termini di ordine di grandezza e significato interpretativo (segni + e -), ma con errori standard minori rispetto a xtlogit RE.
xtlogit FE invece da degli errori standard molto più grandi e dei coefficienti che hanno anche meno senso da un punto di vista interpretativo, per cui fino ad ora sembra la soluzione peggiore. inoltre xtlogit FE mi porta a perdere un numero consistente di informazioni. hausman-taylor invece nel mio caso non è implementabile mediante Stata dato che il mio modello non possiede tutte le quattro categorie necessarie per la sua implementazione con questo software (endogenous + exogenous /time variant + time invariant).
l'ambito particolare per cui sto facendo i test è quello economico-finanziario, e purtroppo ho visto anche io che il mondo accademico sembra essere un pò diviso su quale possa essere il modello migliore da adottare in un caso come il mio...
ultimo aggiornamento: nella mattinata ho guardato un pò meglio i modelli mixed effects, in particolare anche Cameron e Trivedi, pag. 298.
Nel manuale di Stata o da autori come ad es. Schunck (2013) vengono presentati i modelli mixed effects come modelli più flessibili rispetto a FE o RE "puri"... ma Cameron e Trivedi (pag. 298) sottolineano che in realtà la terminologia "fixed effects" relativa ai coefficienti beta stimati con mixed effects è in realtà molto diversa dagli effetti fissi che sono considerati invece dal test hausman, e che se l'ultima tipologia di effetti fissi è presente nel modello ciò può rendere gli stimatori inconsistenti.
Quindi che cos'altro potrei tentare?
avendo compilato manualmente tutto il database xtlogit RE ha in effetti dato dei coefficienti che erano quelli che mi aspettavo per l'analisi che devo svolgere... propenderei per quella tipologia di modello, naturalmente spiegando nelle conclusioni e limitazioni del mio paper le tipologie di problematiche che sono sorte nell'implementazione dei modelli, sempre nel caso in cui in questi giorni non riesca a trovare una soluzione migliore...