L’autocorrelazione si riferisce al grado di correlazione tra i valori delle stesse variabili attraverso diverse osservazioni nei dati. Il concetto di autocorrelazione è più spesso discusso nel contesto dei dati delle serie temporali in cui le osservazioni si verificano in diversi punti nel tempo (ad esempio, la temperatura dell’aria misurata in diversi giorni del mese). Per esempio, ci si potrebbe aspettare che la temperatura dell’aria del 1° giorno del mese sia più simile alla temperatura del 2° giorno rispetto al 31° giorno. Se i valori di temperatura che si sono verificati più vicini nel tempo sono, infatti, più simili dei valori di temperatura che si sono verificati più lontani nel tempo, i dati sarebbero autocorrelati.
Tuttavia, l’autocorrelazione può verificarsi anche in dati cross-sectional quando le osservazioni sono correlate in qualche altro modo. In un sondaggio, per esempio, ci si potrebbe aspettare che persone provenienti da luoghi geografici vicini forniscano risposte più simili tra loro rispetto a persone geograficamente più distanti. Allo stesso modo, gli studenti della stessa classe potrebbero avere risultati più simili tra loro rispetto agli studenti di classi diverse. Quindi, l’autocorrelazione può verificarsi se le osservazioni sono dipendenti in aspetti diversi dal tempo. L’autocorrelazione può causare problemi nelle analisi convenzionali (come la regressione ordinaria dei minimi quadrati) che presuppongono l’indipendenza delle osservazioni.
In un’analisi di regressione, l’autocorrelazione dei residui della regressione può verificarsi anche se il modello è specificato in modo errato. Per esempio, se si sta tentando di modellare una semplice relazione lineare ma la relazione osservata non è lineare (cioè, segue una funzione curva o a forma di U), allora i residui saranno autocorrelati.
Come rilevare l’autocorrelazione
Un metodo comune per verificare l’autocorrelazione è il test di Durbin-Watson. I software statistici come SPSS possono includere l’opzione di eseguire il test di Durbin-Watson quando si conduce un’analisi di regressione. Il test di Durbin-Watson produce una statistica di test che va da 0 a 4. I valori vicini a 2 (il centro della gamma) suggeriscono una minore autocorrelazione, e i valori più vicini a 0 o 4 indicano rispettivamente una maggiore autocorrelazione positiva o negativa.
Pagine web aggiuntive relative all’autocorrelazione
- Inserimento e gestione dei dati
- Valori mancanti nei dati
- Multicollinearità
- Imputazione multipla per dati mancanti