Analisi delle serie storiche...help

nicosaturno
Cari utenti.
Per prima cosa mi presento: sono Nicolo', uno studente di Economia (politica) della Sapienza di Roma.

Sono approdato in questo forum dopo aver cercato inutilmente altri luoghi in cui parlare di "analisi delle serie storiche".

Vi spiego un attimino il mio problema.
Sto cercando di stimare con SPSS dei valori futuri della produzione di energia elettrica (per la tesi specialistica).
Vi chiedo quindi aiuto, perchè, pur ottenendo dei risultati, ho bisogno di qualcuno che mi spieghi alcune cose.

C'è qualche anima pia?
in particolar modo non capisco bene la trasformazione della serie storica.

Per alcune previsioni ottengo dei risultati migliori applicando una trasformazione logaritmica (ln), per altre applicando una radice quadrata.
Il problema è che devo giustificare tali trasformazioni in qualche modo, non posso scrivere "è quella che mi sembra migliore"

c'è qualche masochista disposto a perdere un po di tempo?

grazie e a buon rendere (una citazione sulla mia tesi ^_^ ).

PS
probabilmente penserete: ma vedi un po questo che cerca qualcuno che gli risolva i problemi
In realtà ho semplicemente bisogno di alcune pareri sull'argomento, e quindi ho pensato di sfruttare "il potere della rete"

grazie a tutti

Risposte
nicosaturno
Sergio ciao :D
grazie veramente della risposta, significa molto per me avere qualcuno con cui interloquire su argomenti per me abbastanza nuovi.
Cmq anche io sono di Roma, cosa studi?

Nel merito del problema vorrei applicare un modello di livellamento esponenziale, perchè è quello che concettualmente capisco meglio e più semplice (non richiede di inserire alcun parametro, come invece serve per il modello ARIMA...non saprei dove mettere le mani :D).

Ti espongo il problema graficamente, che forse è più semplice.
Questa è la serie storica della produzione di elettricità da gas naturale dal 1963 fino al 2009


devo stimare la produzione al 2030.

SPSS mi consente di scegliere, per quanto riguarda il livellamento esponenziale:
SEMPLICE (che non uso perchè c'è un trend, giusto?), lineare di HOLT, lineare di BROWN, trend SMORZATO.

Inoltre posso trasformare la variabile dipendente applicando: nessuna trasformazione, radice quadrata, logaritmo.

I risultati migliori (se confrontatI con previsioni fatte da altri, come ad esempio il ministero) le ottengo con il livellamento di HOLT+applicando una trasformazione radice quadrata.
Il problema è che non so giustificare statisticamente l'applicazione di questi modelli e parametri, cioè non so dire "il perchè" funzionano.

ecco i risultati applicando un LIVELLAMENTO ESPONENZIALE CON TREND LINEARE DI HOLT

Trasformando i valori con la radice quadrata (risultato BUONO)



Trasformando i valori con il logaritmo (previsioni di crescita troppo elevate)



Senza alcuna trasformazione (ho addirittura una previsione di decrescita, cosa non fattibile)



Delle 3 soltanto il primo è simile a delle previsioni che ho in altre pubblicazioni. Ma perchè funziona meglio applicando la radice quadrata? in econometria perchè si applica la radice quadrata ai valori?
Da quanto ho capito di solito si applica il logaritmo naturale per eliminare l'eteroschedasticità...ma la radice?

grazie veramente,
Nicolò

cradav
Quando usi un modello di previsione lineare, come per esempio quello di Holt, questo "funziona" solo se la serie storica ha un trend lineare nel tempo.
La tua serie della produzione lorda presenta, senza dubbio un trend quadratico (cresce come il ramo positivo di una parabola), o magari esponenziale.
A questo punto, per avere una serie lineare e poter applicare il modello di previsione fai la trasformazione inversa. E infatti ottieni un trend lineare con entrambe le trasformazioni inverse (radice e logaritmo).

Questo è il perchè si applica la trasformazione, poi è vero che nell'analisi delle serie storiche il tipo particolare di trasformazione sta all'esperienza e alle valutazioni dell'analista. Ricordati solo che i valori predetti dal modello saranno rispettivamente la radice e/o il logaritmo delle quantità di interesse. Credo tu possa tranquillamente giustificare entrambe le trasformazioni sulla base dei tuoi dati e applicare quella che ti soddisfa di più.

In bocca al lupo!

nicosaturno
Cradav grazie anche a te della risposta!!! :-D ...è sempre bello trovare persone disposte ad aiutarti anche su argomenti così "non convenzionali ^_^).

Effettivamente avevo intuito che l'applicazione della trasformazione servisse per linearizzare la serie, la stessa cosa che viene fatta per la regressione in sostanza (io sono fermo alle regressioni lineari, figurati un po :D).

Il problema è che di solito si applica il logaritmo per linearizzare. Vi faccio vedere i grafici delle serie storiche applicando il logaritmo e la radice quadrata. Effettivamente con entrambe le trasformazioni si linearizzano, ma con il logaritmo di più....ma con il logaritmo mi vengono poi dei tassi di crescita troppo elevati :(

ORIGINALE


TRASFORMAZIONE LOGARITMICA


TRASFORMAZIONE RADICE

Per la "ri-trasformazione" delle previsioni, per fortuna ci pensa SPSS :D


Un'ultima cosa. Vi faccio vedere il modello HOLT applicato alla serie storica SENZA IL DATO DEL 2009 (ahime ci si è messa pure al crisi internazionale a complicarmi i dati ^_^).
Non ho applicato NESSUNA TRASFORMAZIONE.

HOLT SENZA DATO 2009 (nessuna trasformazione)


HOLT CON IL DATO DEL 2009 (nessuna trasformazione)


Perchè il modello è così sensibile al dato finale??

grazie a tutti!!!

PS
le immagini dei grafici si vedono? ho paura di aver fatto un lungo lavoro per niente :D

nicosaturno
Inoltre: se avete idee e consigli su come trasformare i dati o sui modelli di previsione da applicare questi sono sempre ben accetti!! :D

Secondo voi un modello ARIMA è più adatto per una serie del genere rispetto ad una con un trend lineare?
Anche i modelli arima stimano dei trend lineari?
inoltre da quanto ho capito i modelli ARIMA si applicano nel caso di "non stazionarietà", che in poche parole significa nei casi in cui la serie storica ha la media o la varianza che cambiano nel tempo? giusto?

cradav
Il modello di holt è molto sensibile al dato finale perchè fa diventare negativa la pendenza della tua serie al tempo T=2009. Questo accade perchè il modello di holt stima la pendenza e l'intercetta della serie al tempo t basandosi sui parametri della serie al tempo t-1. Poi utilizza i valori stimati nell'ultimo periodo per fare una predizione lineare. Questo significa che se la tua serie ha pendenza negativa al tempo T=2009 la retta di predizione avrà pendenza negativa. è per questo che la serie deve essere lineare e non lineare-a-tratti, altrimenti rischi controindicazioni come il tuo.

Il mio consiglio è che siccome stai facendo predizioni di lungo periodo, puoi considerare il 2009 un "outlier" dovuto alla situazione di crisi economica. Quindi potresti far partire la predizione direttamente dal 2008, giustificando la tua scelta.

Per avere un'idea più chiara di come funzionano questi modelli in teoria ti consiglio di dare un'occhiata a:

http://books.google.it/books?hl=it&lr=& ... &q&f=false

è un libro introduttivo dove i modelli sono spiegati in maniera molto semplice.

Ciao nico

nicosaturno
Cradav grazie veramente!
E' un argomento molto interessante questo delle serie storiche, che stupidamente all'università ho sempre evitato (ho preferito fare esami di demografia, pensa un po te :D).

In realtà devo dire che il dato del 2009 è molto importante, perchè senza considerare tale dato e applicando un trend lineare avrei un valore per il 2009 molto sovrastimato (per farti un esempio verrebbero 180TWh di produzione di elettricità, quando nel 2009 ne sono stati prodotti 145TWh).
Questa sovrastima me la porto dietro in ogni periodo determinando delle previsioni troppo elevate al 2030.

Cmq anche applicando una trasformazione (la radice nel mio caso) avrei una pendenza negativa nell'ultimo periodo nella serie storica, poi però la retta di predizione di holt non ha una pendenza negativa...

nicosaturno
a bhe, forse ho capito il perchè....applicando una radice quadrata alla serie storica, i valori predetti vengono poi rielevati al quadrato da SPSS e quindi la pendenza da negativa diventa positiva....

EDIT
no, mesà che ho detto una vaccata :D

nicosaturno
Ho una domanda. I parametri alpha e beta del modello di Holt vengono stimati da SPSS con la minimizzazione dell'MSE?
Perchè non mi consente di inserire i parametri! Credo quindi li scelga lui minimizzando...qualcuno ha informazioni a riguardo?

grazie ancora,
Nicolò

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.