Confronto GLM non annidiati
Buongiorno a tutti.
sto studiando i glm, qualcuno di voi conosce tecniche di confronto di modelli non annidiati?
finchè sono annidiati, tutto ok, si può anche fare il test di ipotesi sulla differenza di devianze residue che in caso di validità dell'ipotesi nulla si distribuisce come una chi quadrato.
se però confronto due modelli che predicono la medesima variabile con covariate diverse? qualcuno saprebbe indicarmi il metodo più adatto? conosco l'indice AIC ma non mi convince del tutto.
inoltre se dovessi confrontare la bontà di adattamento di un glm con un modello predittivo diverso (tipo HLM?), come si possono confrontare modelli diversi in generale?
grazie mille a tutti x l'aiuto
sto studiando i glm, qualcuno di voi conosce tecniche di confronto di modelli non annidiati?
finchè sono annidiati, tutto ok, si può anche fare il test di ipotesi sulla differenza di devianze residue che in caso di validità dell'ipotesi nulla si distribuisce come una chi quadrato.
se però confronto due modelli che predicono la medesima variabile con covariate diverse? qualcuno saprebbe indicarmi il metodo più adatto? conosco l'indice AIC ma non mi convince del tutto.
inoltre se dovessi confrontare la bontà di adattamento di un glm con un modello predittivo diverso (tipo HLM?), come si possono confrontare modelli diversi in generale?
grazie mille a tutti x l'aiuto
Risposte
L'AIC in realtà funziona bene e c'è tutta una teoria sotto che dimostra perchè è valido.
Se invece vuoi qualcosa di più pratico, usa la cross validation: di solito io elimino un gruppo di osservazioni dal dataset, stimo il modello con le restanti e poi faccio previsione su quelle eliminate. La media delle differenze al quadrato tra osservato e predetto ti da un indice di bontà del modello. Se la stima del modello non richiede troppo tempo, puoi utilizzare la leave one out cross validation.
Se invece vuoi qualcosa di più pratico, usa la cross validation: di solito io elimino un gruppo di osservazioni dal dataset, stimo il modello con le restanti e poi faccio previsione su quelle eliminate. La media delle differenze al quadrato tra osservato e predetto ti da un indice di bontà del modello. Se la stima del modello non richiede troppo tempo, puoi utilizzare la leave one out cross validation.