自己相関とは、データ中の異なる観測点における同じ変数の値の間の相関の度合いを意味します。 自己相関の概念は、異なる時点で観測された時系列データの文脈で最もよく議論されます (例: 月の異なる日に測定された気温)。 例えば、1日目の気温と2日目の気温は、31日目の気温と比べてより似ていると考えられます。
しかし、自己相関は、観測値が他の方法で関連している場合、横断的なデータでも発生します。 例えば、アンケート調査では、地理的に近い場所にいる人は、地理的に離れた場所にいる人よりも、お互いに似たような回答をすることが予想されます。 同様に,同じクラスの学生は,異なるクラスの学生よりも,互いに似たような成績を示すかもしれません。 このように、観測結果が時間以外の面で依存している場合、自己相関が発生する可能性があります。
回帰分析では、モデルが正しく指定されていない場合にも、回帰残差の自己相関が発生することがあります。
自己相関を検出する方法
自己相関をテストする一般的な方法は、Durbin-Watsonテストです。 SPSSなどの統計ソフトには、回帰分析を行う際にDurbin-Watson検定を実行するオプションが含まれていることがあります。 Durbin-Watson 検定は、0 から 4 までの範囲の検定統計量を生成します。2(範囲の中央)に近い値は、自己相関が少ないことを示し、0 または 4 に近い値は、それぞれ正または負の自己相関が大きいことを示します。
自己相関に関連する追加のウェブページ
- データの入力と管理
- データの欠損値
- 多重共線性
- 欠損データの多重インピュテーション