L’autocorrélation fait référence au degré de corrélation entre les valeurs des mêmes variables à travers différentes observations dans les données. Le concept d’autocorrélation est le plus souvent discuté dans le contexte des données de séries temporelles dans lesquelles les observations se produisent à différents moments dans le temps (par exemple, la température de l’air mesurée à différents jours du mois). Par exemple, on peut s’attendre à ce que la température de l’air le 1er jour du mois soit plus similaire à la température du 2ème jour qu’à celle du 31ème jour. Si les valeurs de température qui se sont rapprochées dans le temps sont, en fait, plus similaires que les valeurs de température qui se sont éloignées dans le temps, les données seraient autocorrélées.
Cependant, l’autocorrélation peut également se produire dans les données transversales lorsque les observations sont liées d’une autre manière. Dans une enquête, par exemple, on pourrait s’attendre à ce que les personnes provenant de lieux géographiques proches fournissent des réponses plus similaires les unes aux autres que les personnes plus éloignées géographiquement. De même, les élèves d’une même classe peuvent avoir des résultats plus similaires que les élèves de classes différentes. Ainsi, l’autocorrélation peut se produire si les observations dépendent d’autres aspects que le temps. L’autocorrélation peut poser des problèmes dans les analyses classiques (comme la régression par les moindres carrés ordinaires) qui supposent l’indépendance des observations.
Dans une analyse de régression, l’autocorrélation des résidus de la régression peut également se produire si le modèle est mal spécifié. Par exemple, si vous tentez de modéliser une relation linéaire simple mais que la relation observée n’est pas linéaire (c’est-à-dire qu’elle suit une fonction courbe ou en forme de U), alors les résidus seront autocorrélés.
Comment détecter l’autocorrélation
Une méthode courante pour tester l’autocorrélation est le test de Durbin-Watson. Les logiciels statistiques tels que SPSS peuvent inclure l’option d’exécution du test de Durbin-Watson lors de la réalisation d’une analyse de régression. Le test de Durbin-Watson produit une statistique de test qui varie de 0 à 4. Les valeurs proches de 2 (le milieu de la fourchette) suggèrent une autocorrélation moindre, et les valeurs proches de 0 ou 4 indiquent respectivement une autocorrélation positive ou négative plus importante.
Pages Web supplémentaires relatives à l’autocorrélation
- Saisie et gestion des données
- Valeurs manquantes dans les données
- Multicollinéarité
- Imputation multiple pour les données manquantes
.