La autocorrelación se refiere al grado de correlación entre los valores de las mismas variables a través de diferentes observaciones en los datos. El concepto de autocorrelación se discute más a menudo en el contexto de los datos de series temporales en los que las observaciones se producen en diferentes puntos en el tiempo (por ejemplo, la temperatura del aire medida en diferentes días del mes). Por ejemplo, cabe esperar que la temperatura del aire del primer día del mes sea más similar a la del segundo día que a la del 31. Si los valores de temperatura que se produjeron más cerca en el tiempo son, de hecho, más similares que los valores de temperatura que se produjeron más lejos en el tiempo, los datos estarían autocorrelacionados.
Sin embargo, la autocorrelación también puede ocurrir en los datos transversales cuando las observaciones están relacionadas de alguna otra manera. En una encuesta, por ejemplo, se podría esperar que las personas de ubicaciones geográficas cercanas proporcionen respuestas más similares entre sí que las personas que están más alejadas geográficamente. Del mismo modo, los estudiantes de la misma clase pueden tener un rendimiento más similar entre sí que los estudiantes de clases diferentes. Así pues, la autocorrelación puede producirse si las observaciones dependen en aspectos distintos del tiempo. La autocorrelación puede causar problemas en los análisis convencionales (como la regresión por mínimos cuadrados ordinarios) que asumen la independencia de las observaciones.
En un análisis de regresión, la autocorrelación de los residuos de la regresión también puede ocurrir si el modelo se especifica incorrectamente. Por ejemplo, si está intentando modelar una relación lineal simple pero la relación observada no es lineal (es decir, sigue una función curva o en forma de U), entonces los residuos estarán autocorrelacionados.
Cómo detectar la autocorrelación
Un método común para comprobar la autocorrelación es la prueba de Durbin-Watson. El software estadístico, como el SPSS, puede incluir la opción de ejecutar la prueba de Durbin-Watson al realizar un análisis de regresión. La prueba de Durbin-Watson produce un estadístico de prueba que oscila entre 0 y 4. Los valores cercanos a 2 (el centro del rango) sugieren una menor autocorrelación, y los valores más cercanos a 0 o 4 indican una mayor autocorrelación positiva o negativa, respectivamente.
Páginas web adicionales relacionadas con la autocorrelación
- Entrada y gestión de datos
- Valores perdidos en los datos
- Multicolinealidad
- Imputación múltiple de datos perdidos