相関係数について
今日は相関係数について。
相関係数
相関係数とは共分散と標準偏差を使って-1から1までの間で関係性を示す計算方法。
相関係数 = xyの共分散 / xの標準偏差 × yの標準偏差
で表される。
では復習も兼ねて、共分散と標準偏差の求め方も記載する。
x = [ 50 , 70 , 60 ]
y = [ 20 , 30 , 90 ]
という値を使う。
共分散は、
①まずx、yの平均値を求める。 → x:60 y:46(小数点は切り捨て)
②x、yのそれぞれの値を平均値から引く。 → x:[ -10 , 10 , 0] y:[ -26 , 16 , 44]
③対応するそれぞれの要素を掛け算して、足算 → x*y = [ 260 + 160 + 0 ] → 420
④この420の平均を出す → 140 これが共分散になる。
標準偏差は
①まずx平均値を求める。 → x:60
②xのそれぞれの値を平均値から引く。 → x:[ -10 , 10 , 0]
③それぞれの値を2乗して足算する → x:[ 100 + 100 + 0] : 解は200
④そして、この解のへいきんを算出 → 66.6666666666
⑤そして標準偏差はルートで計算されているので、実数に戻してあげる → x 8.1
⑥yにも同じように求める。 yの標準偏差は [676 + 256 + 1936 ] → 30.9
これで上記の
相関係数 = xyの共分散 / xの標準偏差 × yの標準偏差
の式の数字が出た。
相関係数 = 140 / 8.1 * 30.9 → 0.5593… になる。
このように相関係数は
- 1 ~ 1 の間で推移して、今回だと正の数に倒れたので、
xが大きくなったらyも大きくなる、っていう指標になる。
0は全く関係ない。
マイナスはxが大きくなったらyは小さくなり、その逆も然り、って話だ。
では、また。