Boundless Statistics

Hypothesis Tests with the Pearson Correlation

サンプルデータの線形関係が母集団の関係を効果的にモデル化しているかどうかを判断するために、相関係数をテストします

Learning Objectives

Pearsonの相関係数の有意性を判断するために仮説検定を使用します。

Key Takeaways

Key Points

  • Pearsonの相関係数\text{r}は、回帰プロット上の点\text{x}と点\text{y}の間の線形関係の強さを教えてくれます。
  • 仮説検定とは、標本相関係数\{r}と標本サイズ\{n}に基づいて、母集団相関係数\{rho}の値が「0に近い」か「0から有意に異なる」かを判断するものです。
  • テストの結果、相関係数が0から有意に異なる場合、その相関係数は「有意」であると言います。
  • テストの結果、相関係数が0から有意に異ならない(0に近い)場合、その相関係数は「非有意」であると言います。

主要用語

  • ピアソンの相関係数。 2つの変数\text{X}と\text{Y}の間の線形相関(依存性)を表す指標で、+1から-1の間の値を与え、1は完全な正の相関、0は無相関、-1は負の相関を表します。

Testing the Signing of the Correlation Coefficient

Pearsonの相関係数である\text{r}は、回帰プロット上の点\text{x}と点\text{y}の間の線形関係の強さを示しています。 しかし、線形モデルの信頼性は、観測されたデータポイントがサンプルの中にどれだけあるかにも依存します。 相関係数の値とサンプルサイズの両方を一緒に見る必要があります。

仮説検定では、母集団の相関係数\rhoの値が「0に近い」か「0から有意に異なる」かを判断します。

仮説検定では、母集団の相関係数が「0に近い」のか「0から有意に異なる」のかを、サンプルの相関係数とサンプルサイズに基づいて判断します。

結論。 “There is enough evidence to conclude a significant linear relationship between ˶‾᷄ -̫ ‾᷅˵”

What the conclusion means: There is a significant linear relationship between ˶ˆ꒳ˆ˵ )

テストの結果、相関係数が0から有意に異ならない(0に近い)と結論づけられた場合、その相関係数は「有意ではない」と言います。 “

結論です。 “There is insufficient evidence to conclude a significant linear relationship between ˶‾᷄ -̫ ‾᷅˵”

この結論の意味するところは There is no significant linear relationship between ˶ˆ꒳ˆ˵ )

Performing the Hypothesis Test

我々の帰無仮説は、相関係数が 0 から有意に異ならないというものです。 Alternative hypothesis will be that the population correlation coefficient IS significant different from 0. There is a significant linear relationship (correlation) between ˶‾᷄ -̫ ‾᷅˵

Using a Table of Critical Values to Make a Decision

下記のサンプル相関係数表の95%臨界値を見ると、計算された\\の値が有意であるかどうかがよくわかります。 表の中の適切な臨界値と\\を比較してみてください。 臨界値が正の値と負の値の間になければ、その相関係数は有意です。

image

サンプル相関係数表の95%臨界値です。

例として、\{n}=10のデータポイントを使って、\{r}=0.801を計算したとします。 \このとき、\text{df}=-2 =10-2 = 8となり、8の臨界値は0.632となります。 もし、\\が負の臨界値よりも小さいか、正の臨界値よりも大きい場合、\\は有意であると言えます。

Assumptions in Testing the Signation Coefficient

相関係数の有意性をテストするには、データに関する一定の仮定を満たす必要があります。 この検定の前提は、データがより大きな母集団から取られた観測点のサンプルであるということです。 母集団全体を調査することは不可能であり、実現不可能であるため、母集団全体を調査していません。

有意性の検定の基礎となる仮定は次のとおりです。

  • 母集団には、さまざまな値の\text{x}の平均値をモデル化する線形関係があります。 言い換えれば、各特定の値に対する\\の期待値は、母集団の中で直線上にあります。 母集団の直線の方程式はわかりません。 サンプルから得られた回帰直線は、母集団におけるこの直線の最良の推定値です。
  • 任意の特定の\{x}の値に対する\{y}の値は、直線に対して正規に分布しています。 これは、線に近いところにある\\\\\\\\\\\\\\\\\\\\\⁾⁾ということを意味しています。 上記の仮定1は、これらの正規分布が線を中心にしていることを意味します。つまり、これらの正規分布の平均値は線上にあります。
  • 残差誤差は相互に独立している(パターンがない)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です