Interpretazione output regressione logistica binaria
Buongiorno
Vorrei chiedere a qualcuno di più esperto di me un consiglio su come poter interpretare l'output fornito dal software gretl in tema di regressione logistica.
Come si vede, risultano significativi solo 2 coefficienti, il che non mi infonde molta speranza sulla bontà reale del modello.
Inoltre se do l'input "test"; "ometti variabili"; "eliminazione sequenziale delle variabili usando p-value a due code [0,10]" i coefficienti significativi risultano 3: x5 x6 e x8, con livello di signficatività 0,05, se qualcuno conosce o inntuisce ciò che il software fa in seguito a tale comando e potesse spiegarmelo anche sommariamente gliene sarei grato.
Inoltre vorrei, se possibile, qualche informazione sui criteri di informazione [schwarz, akaike, HQ] e sulla statistica F, presente nei due test per le variabili omesse che si trovano in fondo al foglio.
Qualsiasi ulteriore osservazione che ad un occhio esperto può sembrare interessante e di cui io nemmeno mi sono interessato è molto ben accetta.
Sto preparando una tesi magistrale in economia.
Grazie
Modello 1: Logit, usando le osservazioni 1-46
Variabile dipendente: Y
Errori standard basati sull'Hessiana
coefficiente errore std. z p-value
----------------------------------------------------------
const −2,37339 1,17265 −2,024 0,0430 **
X1 −0,128644 3,81117 −0,03375 0,9731
X2 −1,21639 1,14853 −1,059 0,2896
X3 1,26625 1,83852 0,6887 0,4910
X4 0,607880 0,720187 0,8441 0,3986
X5 −13,2893 7,96425 −1,669 0,0952 *
X6 9,36611 5,34132 1,754 0,0795 *
X7 1,21795 2,07882 0,5859 0,5580
X8 −12,2816 17,4716 −0,7029 0,4821
X9 3,65772 17,3508 0,2108 0,8330
X10 −2,38750 5,10322 −0,4678 0,6399
X11 −0,333050 1,77475 −0,1877 0,8511
X12 0,834097 0,807369 1,033 0,3016
X13 3,62223 4,46697 0,8109 0,4174
X14 0,440083 0,686954 0,6406 0,5218
Media var. dipendente 0,304348 SQM var. dipendente 0,465215
R-quadro di McFadden 0,563974 R-quadro corretto 0,033323
Log-verosimiglianza −12,32521 Criterio di Akaike 54,65042
Criterio di Schwarz 82,08005 Hannan-Quinn 64,92573
Note: SQM = scarto quadratico medio; E.S. = errore standard
Numero dei casi 'previsti correttamente' = 40 (87,0%)
f(beta'x) nella media delle variabili indipendenti = 0,078
Test del rapporto di verosimiglianza: Chi-quadro(14) = 31,8839 [0,0042]
Previsto
0 1
Effettivo 0 29 3
1 3 11
Escludendo la costante, il p-value è massimo per la variabile 1 (X1)
Test per le variabili omesse -
Ipotesi nulla: i parametri valgono zero per le variabili
X1
X2
X3
X4
X7
X9
X10
X11
X12
X13
X14
Statistica test: F(11, 31) = 0,381079
con p-value = P(F(11, 31) > 0,381079) = 0,953764
Test per le variabili omesse -
Ipotesi nulla: i parametri valgono zero per le variabili
X1
X2
X3
X4
Statistica test: F(4, 31) = 0,621381
con p-value = P(F(4, 31) > 0,621381) = 0,650675
Test per le variabili omesse -
Ipotesi nulla: i parametri valgono zero per le variabili
X5
X6
X7
X8
X9
X10
X11
X12
X13
X14
Statistica test: F(10, 31) = 0,702472
con p-value = P(F(10, 31) > 0,702472) = 0,714889
Vorrei chiedere a qualcuno di più esperto di me un consiglio su come poter interpretare l'output fornito dal software gretl in tema di regressione logistica.
Come si vede, risultano significativi solo 2 coefficienti, il che non mi infonde molta speranza sulla bontà reale del modello.
Inoltre se do l'input "test"; "ometti variabili"; "eliminazione sequenziale delle variabili usando p-value a due code [0,10]" i coefficienti significativi risultano 3: x5 x6 e x8, con livello di signficatività 0,05, se qualcuno conosce o inntuisce ciò che il software fa in seguito a tale comando e potesse spiegarmelo anche sommariamente gliene sarei grato.
Inoltre vorrei, se possibile, qualche informazione sui criteri di informazione [schwarz, akaike, HQ] e sulla statistica F, presente nei due test per le variabili omesse che si trovano in fondo al foglio.
Qualsiasi ulteriore osservazione che ad un occhio esperto può sembrare interessante e di cui io nemmeno mi sono interessato è molto ben accetta.
Sto preparando una tesi magistrale in economia.
Grazie
Modello 1: Logit, usando le osservazioni 1-46
Variabile dipendente: Y
Errori standard basati sull'Hessiana
coefficiente errore std. z p-value
----------------------------------------------------------
const −2,37339 1,17265 −2,024 0,0430 **
X1 −0,128644 3,81117 −0,03375 0,9731
X2 −1,21639 1,14853 −1,059 0,2896
X3 1,26625 1,83852 0,6887 0,4910
X4 0,607880 0,720187 0,8441 0,3986
X5 −13,2893 7,96425 −1,669 0,0952 *
X6 9,36611 5,34132 1,754 0,0795 *
X7 1,21795 2,07882 0,5859 0,5580
X8 −12,2816 17,4716 −0,7029 0,4821
X9 3,65772 17,3508 0,2108 0,8330
X10 −2,38750 5,10322 −0,4678 0,6399
X11 −0,333050 1,77475 −0,1877 0,8511
X12 0,834097 0,807369 1,033 0,3016
X13 3,62223 4,46697 0,8109 0,4174
X14 0,440083 0,686954 0,6406 0,5218
Media var. dipendente 0,304348 SQM var. dipendente 0,465215
R-quadro di McFadden 0,563974 R-quadro corretto 0,033323
Log-verosimiglianza −12,32521 Criterio di Akaike 54,65042
Criterio di Schwarz 82,08005 Hannan-Quinn 64,92573
Note: SQM = scarto quadratico medio; E.S. = errore standard
Numero dei casi 'previsti correttamente' = 40 (87,0%)
f(beta'x) nella media delle variabili indipendenti = 0,078
Test del rapporto di verosimiglianza: Chi-quadro(14) = 31,8839 [0,0042]
Previsto
0 1
Effettivo 0 29 3
1 3 11
Escludendo la costante, il p-value è massimo per la variabile 1 (X1)
Test per le variabili omesse -
Ipotesi nulla: i parametri valgono zero per le variabili
X1
X2
X3
X4
X7
X9
X10
X11
X12
X13
X14
Statistica test: F(11, 31) = 0,381079
con p-value = P(F(11, 31) > 0,381079) = 0,953764
Test per le variabili omesse -
Ipotesi nulla: i parametri valgono zero per le variabili
X1
X2
X3
X4
Statistica test: F(4, 31) = 0,621381
con p-value = P(F(4, 31) > 0,621381) = 0,650675
Test per le variabili omesse -
Ipotesi nulla: i parametri valgono zero per le variabili
X5
X6
X7
X8
X9
X10
X11
X12
X13
X14
Statistica test: F(10, 31) = 0,702472
con p-value = P(F(10, 31) > 0,702472) = 0,714889