相関係数
目次
相関係数(correlation coefficient)
スポンサーリンク
アフィリエイト広告を利用しています。
1. 相関関係
シャフトのベアリング挿入部の径や、表面粗さなどの測定される項目を変数といいます。今、2つの変数をx,yとするとき、xが変化するとyも変化するような関係を相関関係といいます。
xの増加によりyも増加するような関係を正の相関関係といい、逆にxの増加によりyが減少するような関係を負の相関関係といいます。どちらの関係も観察されず無関係な状態を無相関といいます。
ここで注意しなければならないのは、相関関係と因果関係は別の概念であることです。よくある例題ですが、数学の成績と物理の成績とに、正の相関関係が存在しているとしましょう。
この正の相関関係は、数学の得点が高い人は物理の得点も高く、数学の得点が低い人は物理の得点も低いという傾向を示しています。
しかし、数学を勉強すると、物理の点数が良くなるという因果関係を示しているのではありません。
2つの変数の間に、相関関係があるか否かを調べることを相関分析といいます。相関分析では、以下に示す2つのアプローチで分析が行われます。
① 散布図などのグラフを用いた視覚的な解析
② 相関係数や検定手法を用いた数値的な解析
2. 散布図:QC7つ道具(視覚的な解析)
相関関係の有無を視覚的に直感的に確認できるのが、QC7つ道具の一つ、散布図です。
2つの変数のうち、一方の変数(x)を横軸とし、もう一方の変数(y)を縦軸とし、対応するデータを1点ずつプロットして作成します。図1 は、鉄鋼の添加元素量と硬さとの関係を散布図にした例です。
図1 散布図:相関関係の視覚化の例 出典:第3版 品質管理入門
散布図の点の散らばり方の例については、おおよそ6つのパターンに分類されます。
図2 散布図の点の散らばり方の例 出典:すぐに使えるQC手法を改変
これらの散布図により、点が散布図上でどのように散らばっているかを観察することで、相関関係を視覚的に把握することができます。
3. 相関係数
3.1 相関係数とは
相関係数とは、2つの変数の間に相関関係があるか否かを、数値的に判断するために計算される統計量です。相関係数の計算結果により、相関の有無、強弱を判断します。
相関係数は、通常r という記号で表されます。相関係数rが取る範囲は、-1から +1 までです。
すなわち、
-1 ≦ r ≦ 1
相関関係の符号は、正の相関関係がある場合は+ 、負の相関関係があるときは- となります。
相関関係の強さは、相関係数の絶対値 |r|、または相関係数を2乗した値r2で評価します。
|r|あるいはr2の値が1に近いほど相関関係が強いことを示しています。相関関係が存在しないときは、相関係数の値は0に近い値になります。ちょうど0になることは、非常にまれです。
3.2相関係数と散布図との関係
相関係数rと散布図のパターンを対比させると、図3 のようになります。
図3 相関係数と散布図のパターン
3.3相関係数の考え方
相関係数r の値から、相関関係の強さの程度を判断するための目安を、表4 に示します。
実際には、これらの値は目安で、サンプルサイズn の大きさを考慮して、検定手法を用いて判断する必要があります。
表4 相関係数の強さの程度
4. 相関係数の求め方
相関係数は、2つの変数x,yより、x、yそれぞれの偏差平方和と、x、y偏差積和を求めて計算されます。
以前の研修(データの取り方・まとめ方)では、偏差平方和を簡単に平方和としていましたが、正式に書くと「偏差(データと平均値との差)を平方(2乗)したものの和(足し込むこと)」で、偏差平方和が正しい名称です。これは文献によって、書き方はいろいろあります。
\( S(xx) = \displaystyle \sum_{i=1}^n ( x_{ i } – \overline{ x } )^2 = \displaystyle \sum_{i=1}^n { x_{ i }^2 } -\displaystyle\frac{ \left ( \displaystyle \sum_{i=1}^n x_{ i } \right ) ^2}{ n } \)
\( S(yy) = \displaystyle \sum_{i=1}^n ( y_{ i } – \overline{ y } )^2 = \displaystyle \sum_{i=1}^n { y_{ i }^2 } -\displaystyle\frac{ \left ( \displaystyle \sum_{i=1}^n y_{ i } \right ) ^2}{ n } \)
\( S(xy) = \displaystyle \sum_{i=1}^n ( x_{ i } – \overline{ x } ) ( y_{ i } – \overline{ y } ) = \displaystyle \sum_{i=1}^n { x_{ i } y_{ i } } -\displaystyle\frac{ \displaystyle \sum_{i=1}^n x_{ i } \displaystyle \sum_{i=1}^n y_{ i } }{ n } \)
このとき、相関係数r は、次の式で求められます。
\( r = \displaystyle\frac{ S(xy) }{ \sqrt{ S(xx) \times S(yy) }} \)
5. 相関係数の例題
次に示すデータはアマゾンで任意に抽出したスマートフォン25機種について、体積x(cm3)と質量y(g)を求めたものです(表5)。これらのデータより、xとyとの相関係数rを求めましょう。
表5 スマートフォンの体積と質量との測定結果
x,yの平方和、積和を計算します(表6 )。
計算結果より、\( S(xx) \) (xの偏差平方和)、\( S(yy) \) (yの偏差平方和)、\( S(xy) \) (x,yの偏差積和)を求めます。
\( S(xx) = 319336.61 – \displaystyle\frac{ 2599.02 ^2 }{ 25 } = 49141.04 \)
\( S(yy) = 1024673.00 – \displaystyle\frac{ 4913.00^2 }{ 25 } = 59170.24 \)
\( S(xy) = 559146.67 – \displaystyle\frac{ 2599.02 \times 4913.00 }{ 25 } = 48405.86 \)
これらより、相関係数\( r \) を求めます。
\( r = \displaystyle\frac{ 48405.86 }{ \sqrt{ 49141.04 \times 59170.24 }} = 0.8977 \)
スマートフォンの体積と質量には強い相関関係があることがわかりました。
主要参考文献
QC検定2級品質管理の手法50ポイント 内田弘 日科技連
よくわかる2級QC検定合格テキスト 福井清輔 弘文社
第3版 品質管理入門 石川馨 日科技連 1989年
すぐ使えるQC手法 片山善三郎他 日科技連 1988年
相関分析 生物統計学講義資料 インターネット
引用図表
図1 散布図:相関関係の視覚化の例 出典:第3版 品質管理入門
図2 散布図の点の散らばり方の例 出典:すぐに使えるQC手法を改変
図3 相関係数と散布図のパターン ORIGINAL 参考:https://www.pref.kumamoto.jp/uploaded/attachment/13589.pdf
表4 相関係数の強さの程度 出典:不明
表5 スマートフォン寸法と質量との測定結果 ORIGINAL
表6 計算結果 ORIGINAL
ORG: 2023/06/06