2019/10/15
Excelの「データ分析」を使い「相関係数」を出してみよう(前編)に続き、
今回は実際にExcelの「データ分析」アドインから「相関」機能を使い「相関係数」を出してみましょう。
前回準備した、「市町村国民健康保険+後期高齢者医療制度(都道府県別、診療種別、1人当たり実績医療費)千円」と「人口10万対施設数(病院数)」の相関係数を見てみます。
相関係数の確認
まず、データ分析から相関を選択します。
次に設定を行います。
①入力範囲
対象となるデータの範囲を選択します。
②データ方向
「列」と「行」を選択できます。
今回は「列」を選択します。
③先頭行をラベルとして使用
チェックを入れると、結果に名称が表示されるため、
今回はチェックを入れます。
④出力オプション
出力先、新規ワークシート、新規ブックを選択できます。
今回は、新規ワークシートを選択します。
最後にOKを選択します。
結果が新規ワークシートに作成されます。
B3の値が相関係数で、「0.795383725」となります。
相関係数の値は-1以上1以下です。
相関係数が1に近ければ、正の相関が強く、-1に近づけば負の相関が強くなります。
0に近ければ無相関です。
相関係数の値 | 相関係数の強弱 |
---|---|
0.7~1 | 強い正の相関あり |
0.4~0.7 | 正の相関あり |
0.2~0.4 | 弱い正の相関あり |
-0.2~0.2 | ほぼ関係ない |
-0.4~-0.2 | 弱い負の相関あり |
-0.7~-0.4 | 負の相関あり |
-1~-0.7 | 強い負の相関あり |
今回の結果は約0.79でしたので、
「市町村国民健康保険+後期高齢者医療制度(都道府県別、診療種別、1人当たり実績医療費)千円」と
「人口10万対施設数(病院数)」は強い正の相関がありそうです。
上記の結果を言い換えますと、
「市町村国民健康保険+後期高齢者医療制度(都道府県別、診療種別、1人当たり実績医療費)千円」
の金額が大きいほど、「人口10万対施設数(病院数)」も多くなる傾向が強いと解釈できます。
実際には、上記の結果が有意かどうかまで確認する必要がありますが、今回は、相関係数の算出方法のみを記載させていただきました。
もし、興味がありましたら統計の専門書を読むことをお勧めします。
おまけ:関数を使った相関係数の算出方法
Excelの「データ分析」アドインから「相関」機能を使い「相関係数」を出しましたが、Excelの関数でも出すこと可能です。
関数は、CORREL(コリレーション)関数を使います。
=CORREL(配列1,配列2)
今回の例ですと、
配列1に「市町村国民健康保険+後期高齢者医療制度(都道府県別、診療種別、1人当たり実績医療費)千円」のデータを選択し、
配列2に「市町村国民健康保険※1+後期高齢者医療制度 都道府県別、診療種別、1人当たり実績医療費」を選択します。
=CORREL(B1:B48,C1:C48)
結果は同様に「0.795383725」となります。
データ分析からの相関係数とCORREL関数との相関係数は同じ結果となりますが、データ分析からの相関係数しかできない機能があります。
それは、3つ以上のデータ群を比較する時です。
今回の例では、2つのデータ群で比較しましたが、3つ以上のデータ群を比較する時は、CORREL関数は使用できません。
3つ以上のデータ群を比較する時はデータ分析から相関係数を使用するように覚えておきましょう。
最後までお読みいただきありがとうございました。