Autokorelacja odnosi się do stopnia korelacji pomiędzy wartościami tych samych zmiennych w różnych obserwacjach w danych. Pojęcie autokorelacji jest najczęściej omawiane w kontekście danych szeregów czasowych, w których obserwacje występują w różnych punktach w czasie (np. temperatura powietrza mierzona w różnych dniach miesiąca). Na przykład, można oczekiwać, że temperatura powietrza w pierwszym dniu miesiąca będzie bardziej podobna do temperatury w drugim dniu w porównaniu do temperatury w dniu 31. Jeśli wartości temperatury, które wystąpiły bliżej siebie w czasie, są w rzeczywistości bardziej podobne niż wartości temperatury, które wystąpiły dalej od siebie w czasie, dane byłyby autokorelacyjne.
Jednakże autokorelacja może również wystąpić w danych przekrojowych, gdy obserwacje są powiązane w inny sposób. W ankiecie, na przykład, można oczekiwać, że ludzie z pobliskich lokalizacji geograficznych udzielą bardziej podobnych odpowiedzi niż ludzie, którzy są bardziej oddaleni geograficznie. Podobnie, uczniowie z tej samej klasy mogą osiągać bardziej podobne wyniki niż uczniowie z różnych klas. Tak więc autokorelacja może wystąpić, jeśli obserwacje są zależne w aspektach innych niż czas. Autokorelacja może powodować problemy w konwencjonalnych analizach (takich jak zwykła regresja najmniejszych kwadratów), które zakładają niezależność obserwacji.
W analizie regresji, autokorelacja reszt regresji może również wystąpić, jeśli model jest nieprawidłowo określony. Na przykład, jeśli próbujesz modelować prostą liniową zależność, ale obserwowana zależność jest nieliniowa (tj. podąża za zakrzywioną lub U-kształtną funkcją), wówczas reszty będą autokorelowane.
Jak wykryć autokorelację
Powszechną metodą testowania autokorelacji jest test Durbina-Watsona. Oprogramowanie statystyczne, takie jak SPSS, może zawierać opcję przeprowadzenia testu Durbina-Watsona podczas przeprowadzania analizy regresji. Test Durbina-Watsona daje statystykę testową, która waha się od 0 do 4. Wartości bliskie 2 (środek zakresu) sugerują mniejszą autokorelację, a wartości bliższe 0 lub 4 wskazują na większą pozytywną lub negatywną autokorelację, odpowiednio.
Dodatkowe strony internetowe związane z autokorelacją
- Wprowadzanie i zarządzanie danymi
- Brakujące wartości w danych
- Multikoliniowość
- Multiple Imputation for Missing Data