Multicollinearità regressione lineare multipla

RufyAce
Salve a tutti, volevo esporvi il mio problema. In pratica devo effettuare una regressione lineare con 2 predittori che sono costituiti dalla variabile x e dalla variable x^2. Il mio scopo è dimostrare che la variabile dipendente cresce all'aumentare del predittore fino ad un certo punto di massimo, per poi decrescere. Chiaramente, essendo un predittore il quadrato dell'altro, la regressione soffre di multicollinearità.
Da quello che so, la multicollinearità potrebbe causare distorsione nelle stime; però, in molti articoli scientifici ho visto che, nella costruzione di modelli econometrici, ciò viene svolto senza problemi.
Qualcuno potrebbe chiarirmi questa situazione cortesemente?

Risposte
RufyAce
Innanzitutto grazie mille per la risposta così esaustiva. Ti spiego meglio il mio caso:
Ho un campione di 630 elementi e il modello che voglio stimare è del tipo: $ y= β0+β1x+β2x^2+β3z+β4z^2 +β5xz+ε $ .
La correlazione tra x e z è 0,100 con una significativa (2 code) di 0,012.
I miei dubbi nascono proprio quando con SPSS verifico il VIF, per due variabili è pari a 27 mentre per altre 2 è pari a 8,5; ho letto da molte parti che, per non avere problemi di multicollinearità, deve essere minore di 5. Per questo motivo pensavo che il modello da me costruito soffrisse di multicollinearità.
Se ho ben capito, invece, il modello non dovrebbe avere di questi problemi... oppure dovrei fare altre verifiche? E quali?
Scusami se ne approfitto della tua gentilezza ma come avrai ben capito non sono molto ferrato in statistica...

RufyAce
No, 0.1 è proprio l'indice di correlazione tra le variabili. β5 non risulta significativo e l'ho escluso dal modello.
Ora ho il dubbio che sto utilizzando strumenti sbagliati; mi spiego, per creare questo modello ho creato 3 colonne su SPSS, due per i quadrati ed una per il prodotto, e poi ho effettuato una regressione lineare. E' giusto oppure devo utilizzare un altro strumento che non sia la regressione lineare?
Cmq il VIF così alto è causato dalla relazione tra le variabili e i loro quadrati. La loro correlazione è infatti superiore a 0,9. Standardizzando le variabili ottengo VIF tra 2,2 e 2,7. Qui mi sorge un'altra domanda... posso ritenere le stime del modello "non standardizzato" corrette o devo considerare solo le stime del modello "standardizzato"?
Grazie mille di nuovo.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.