Autocorrelatie verwijst naar de mate van correlatie tussen de waarden van dezelfde variabelen bij verschillende waarnemingen in de gegevens. Het begrip autocorrelatie wordt meestal besproken in de context van tijdreeksgegevens waarbij waarnemingen op verschillende tijdstippen worden gedaan (bv. luchttemperatuur gemeten op verschillende dagen van de maand). Men zou bijvoorbeeld kunnen verwachten dat de luchttemperatuur op de 1e dag van de maand meer gelijkenis vertoont met de temperatuur op de 2e dag, dan met die op de 31e dag. Als de temperatuurwaarden die dichter bij elkaar liggen in de tijd inderdaad meer op elkaar lijken dan de temperatuurwaarden die verder uit elkaar liggen in de tijd, zijn de gegevens geautocorreleerd.
Autocorrelatie kan echter ook optreden in transversale gegevens wanneer de waarnemingen op een andere manier aan elkaar gerelateerd zijn. Bij een enquête zou men bijvoorbeeld kunnen verwachten dat mensen uit naburige geografische gebieden meer gelijksoortige antwoorden geven dan mensen die verder van elkaar verwijderd zijn. Evenzo zullen leerlingen uit dezelfde klas wellicht meer op elkaar lijken dan leerlingen uit verschillende klassen. Autocorrelatie kan dus optreden als waarnemingen afhankelijk zijn van andere aspecten dan tijd. Autocorrelatie kan problemen veroorzaken in conventionele analyses (zoals gewone kleinste kwadratenregressie) die uitgaan van onafhankelijkheid van waarnemingen.
In een regressieanalyse kan autocorrelatie van de regressieresiduen ook optreden als het model onjuist is gespecificeerd. Als u bijvoorbeeld probeert een eenvoudige lineaire relatie te modelleren, maar de waargenomen relatie is niet-lineair (d.w.z. volgt een kromme of U-vormige functie), dan zullen de residuen autocorrelatie vertonen.
Hoe autocorrelatie te detecteren
Een veelgebruikte methode om op autocorrelatie te testen is de Durbin-Watson-test. Statistische software zoals SPSS kan de mogelijkheid bieden om de Durbin-Watson test uit te voeren bij het uitvoeren van een regressieanalyse. De Durbin-Watson-test levert een teststatistiek op die varieert van 0 tot 4. Waarden dicht bij 2 (het midden van de reeks) wijzen op minder autocorrelatie, en waarden dichter bij 0 of 4 wijzen respectievelijk op een grotere positieve of negatieve autocorrelatie.
Aan autocorrelatie gerelateerde webpagina’s
- Gegevensinvoer en -beheer
- Valuta in gegevens
- Multicollineariteit
- Multipele Imputatie voor Ontbrekende Gegevens