Autocorrelazione e celle vuote in Excel
Ciao a tutti!
Vi scrivo perché ho un dubbio. Mi sto approcciando all'autocorrelazione (lag 1) nell'analizzare delle serie temporali. Nello specifico, ho dei dati che mi indicano il quanto il battere su un tamburo si discosta da un metronomo. Ho trovato in internet che la correlazione si può calcolare semplicemente in Excel con questa formula =CORRELAZIONE($A$1:$A$29;A2:A30). Questa formula mi sembra semplice e ben si adatta a questa definizione, trovata in un paper "the correlation between the asynchrony series and a copy of itself that has been shifted by one step" con metodi simili al nostro.
In internet ho però trovato quest'altro metodo per il calcolo della autocorrelazione, vi posto il link https://www.youtube.com/watch?v=2psEfizSqOw. Mi sembra un po' più complesso, ma quello che mi turba è che, sugli stessi dati, i due metodi danno coefficienti molto molto simili, ma comunque diversi (per esempio, in un caso ottendo 0.345 e nell'altro 0.331).
Secondo voi, quale dei due è corretto? Inoltre, io a volte nei miei dati ho delle celle vuote (per esempio il tamburo non ha registrato qualche battito). Come mi comporto? Tengo sempre in considerazione anche le celle vuote? Se faccio delle prove sui dati, tenendo in conto anche le celle vuote, i due coefficienti di autocorr variano molto se applico un metodo oppure l'altro!
Qual è secondo voi la cosa migliore da fare?
Grazie mille a tutti!
Vi scrivo perché ho un dubbio. Mi sto approcciando all'autocorrelazione (lag 1) nell'analizzare delle serie temporali. Nello specifico, ho dei dati che mi indicano il quanto il battere su un tamburo si discosta da un metronomo. Ho trovato in internet che la correlazione si può calcolare semplicemente in Excel con questa formula =CORRELAZIONE($A$1:$A$29;A2:A30). Questa formula mi sembra semplice e ben si adatta a questa definizione, trovata in un paper "the correlation between the asynchrony series and a copy of itself that has been shifted by one step" con metodi simili al nostro.
In internet ho però trovato quest'altro metodo per il calcolo della autocorrelazione, vi posto il link https://www.youtube.com/watch?v=2psEfizSqOw. Mi sembra un po' più complesso, ma quello che mi turba è che, sugli stessi dati, i due metodi danno coefficienti molto molto simili, ma comunque diversi (per esempio, in un caso ottendo 0.345 e nell'altro 0.331).
Secondo voi, quale dei due è corretto? Inoltre, io a volte nei miei dati ho delle celle vuote (per esempio il tamburo non ha registrato qualche battito). Come mi comporto? Tengo sempre in considerazione anche le celle vuote? Se faccio delle prove sui dati, tenendo in conto anche le celle vuote, i due coefficienti di autocorr variano molto se applico un metodo oppure l'altro!
Qual è secondo voi la cosa migliore da fare?
Grazie mille a tutti!
Risposte
Quella di Excel è l'autocorrelazione teorica, quella del video l'autocorrelazione campionaria. In pratica, nella solita formula della correlazione, vengono sostituite le stime della covarianza e della varianza della variabile.
Senza stare troppo a spiegare la teoria, per un numero abbastanza grande di dati i due coefficienti cambiano poco.
Quella del video è comunque preferibile fra le due ed è anche la formula usata dai principali software statistici.
Senza stare troppo a spiegare la teoria, per un numero abbastanza grande di dati i due coefficienti cambiano poco.
Quella del video è comunque preferibile fra le due ed è anche la formula usata dai principali software statistici.