Analisi dei residui

framaro@tiscali.it
Salve a tutti,
vi chiedo di darmi un aiuto sull'analisi dei residui.
Devo confrontare i residui ricavati da due diverse regressioni.
Ho costruito gli istogrammi e le distibuzioni cumulate (tutto su residui standardizzati).
Da entrambi gli istogrammi, la distribuzione sembra essere lognormale.
Le curve delle distribuzioni cumulate sono praticamente identiche.

Cosa posso dedurre da tutto ciò?

Grazie per l'attenzione e spero mi rispondiate presto..

Risposte
niandra82
I residui si devono distribuire normalmente, se si distribuisco come un log normale , la regressione non è fatta bene

framaro@tiscali.it
Beh.. si.. in realtà la mia regressione è su valori logaritmici e i residui logaritmici hanno distribuzione normale, ma facendo l'esponenziale, ottengo residui con distribuzione lognormale. Giusto?!
Quello che vorrei sapere è come faccio a dire che si tratta proprio di una distribuzione lognormale (oltre a vederlo "a occhio" dall'istogramma).
E cosa mi dice il confronto tra le distribuzioni cumulate?
Che entrambe le popolazioni di residui hanno la stessa distribuzione?
Ho un po' di dubbi.. :?

niandra82
Se fossi in te userei i residui della regressione senza fare l'esponenziale, esistono molti più test che ti permettono di determinare se proviene da questa distribuzine o men....usa shapiro wilk ad esempio...altrimenti se vuoi testare una qualunque distribuzione dei dati usa questo http://it.wikipedia.org/wiki/Test_di_Kolmogorov-Smirnov


A mio parere non è correttofare l'esponenziale e poi testare la log normle, le ipotesi della regressione vogliono che i residui siano normali e non che la loro trasformata esponenziale sia log normale.
In linea teorica potrebbe essere la stessa cosa, ma si parla di variabili aleatorie, quindi di fatto è possibile che i test sulla normalità falliscano, ma facendo l'esponenziale e poi testando la lognormale questi abbiano successo....e non so quanto questo possa essere corretto, potrebbe essere visto come un tentativo di cercare la significatività anche quandfo questa non c'è...(ad esempio potresti farci il quadrato e vedere se è un chi quadrato e continuare nelle trasformazioni finche non trovi un test che ha successo)....

Riguardo alle distribuzioni dei residui, se esse sono identiche (anche la cumulata) significa che l'apporto informativo delle due regressioni è identico, tutte e due spiegano la stessa quantità di varianza, oppure tutti e due lasciano la stessa quantità di varianza nei residui...

G.M.

framaro@tiscali.it
Purtroppo non sono molto esperta in materia.. in pratica ho già fatto tutto, devo solo capire come l'ho fatto... :-/ Allora, ho testato prima i residui logaritmici con Kolmogorov - Smirnov e sono risultati normali. Poi mi sono riportata a quelli esponenziali che, dato che "la distribuzione lognormale è la distribuzione di probabilità di una variabile aleatoria X il cui logaritmo logX segue una distribuzione normale", posso affermare direttamente che quella che ho è una distribuzione lognormale?
E quindi posso cmq affermare che la mia sia stata una buona regressione?

Poi vorrei capire meglio riguardo al confronto tra le ecdf.. Come ho ho detto, le due sono praticamente identiche e come mi hai detto, questo significa che le due distribuzioni possono spiegare la stessa quantità di varianza..
Questo discorso può connettersi al diverso coefficiente di correlazione?

Spero mi risponderai prestissimo! Grazie!!

niandra82
In linea teorica puoi affermare che è stata una buna regressione, ma non si valuta solo in base alla normalità dei residui, devono essere omoschedastici, il valore R^2 deve essere buono e i coefficieni della regressione significativi(e molte altre cose che vanno valutate caso per caso)...

Innanzitutto non sono le distribuzioni che "spiegano" la varianza, ma la regressione....anche in questo caso vanno valutati gli aspetti di prima.....ma come ho detto nel post precedente, due distribuzioni dei residui simili fanno pensare che o usi una regressione o l'altra, i risultati (in teermini di varianza spiegata) sono simili....

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.