患者中心の保健医療を支える
処方情報分析のリーディングカンパニー

 03-3239-6840

Excelの「データ分析」を使い「相関係数」を出してみよう(後編)

time 2017/02/27

※解説記事内の画像はExcel 2010のものです。

Excelの「データ分析」を使い「相関係数」を出してみよう(前編)に続き、
今回は実際にExcelの「データ分析」アドインから「相関」機能を使い「相関係数」を出してみましょう。

前回準備した、「市町村国民健康保険+後期高齢者医療制度(都道府県別、診療種別、1人当たり実績医療費)千円」と「人口10万対施設数(病院数)」の相関係数を見てみます。

相関係数の確認

まず、データ分析から相関を選択します。

ws000085
次に設定を行います。
ws000022
①入力範囲
対象となるデータの範囲を選択します。
ws000023
WS000026
②データ方向
「列」と「行」を選択できます。
今回は「列」を選択します。

③先頭行をラベルとして使用
チェックを入れると、結果に名称が表示されるため、
今回はチェックを入れます。

④出力オプション
出力先、新規ワークシート、新規ブックを選択できます。
今回は、新規ワークシートを選択します。

最後にOKを選択します。

結果が新規ワークシートに作成されます。
WS000049

B3の値が相関係数で、「0.795383725」となります。

相関係数の値は-1以上1以下です。
相関係数が1に近ければ、正の相関が強く、-1に近づけば負の相関が強くなります。
0に近ければ無相関です。

相関係数の値 相関係数の強弱
0.7~1 強い正の相関あり
0.4~0.7 正の相関あり
0.2~0.4 弱い正の相関あり
-0.2~0.2 ほぼ関係ない
-0.4~-0.2 弱い負の相関あり
-0.7~-0.4 負の相関あり
-1~-0.7 強い負の相関あり

今回の結果は約0.79でしたので、
「市町村国民健康保険+後期高齢者医療制度(都道府県別、診療種別、1人当たり実績医療費)千円」と
「人口10万対施設数(病院数)」は強い正の相関がありそうです。

上記の結果を言い換えますと、
「市町村国民健康保険+後期高齢者医療制度(都道府県別、診療種別、1人当たり実績医療費)千円」
の金額が大きいほど、「人口10万対施設数(病院数)」も多くなる傾向が強いと解釈できます。

実際には、上記の結果が有意かどうかまで確認する必要がありますが、今回は、相関係数の算出方法のみを記載させていただきました。
もし、興味がありましたら統計の専門書を読むことをお勧めします。

おまけ:関数を使った相関係数の算出方法

Excelの「データ分析」アドインから「相関」機能を使い「相関係数」を出しましたが、Excelの関数でも出すこと可能です。

関数は、CORREL(コリレーション)関数を使います。

=CORREL(配列1,配列2)

今回の例ですと、
配列1に「市町村国民健康保険+後期高齢者医療制度(都道府県別、診療種別、1人当たり実績医療費)千円」のデータを選択し、
配列2に「市町村国民健康保険※1+後期高齢者医療制度 都道府県別、診療種別、1人当たり実績医療費」を選択します。

=CORREL(B1:B48,C1:C48)

結果は同様に「0.795383725」となります。

データ分析からの相関係数とCORREL関数との相関係数は同じ結果となりますが、データ分析からの相関係数しかできない機能があります。

それは、3つ以上のデータ群を比較する時です。

今回の例では、2つのデータ群で比較しましたが、3つ以上のデータ群を比較する時は、CORREL関数は使用できません。
3つ以上のデータ群を比較する時はデータ分析から相関係数を使用するように覚えておきましょう。

最後までお読みいただきありがとうございました。

タグ

このブログについて

このブログ(JMIRI Office部)は、製薬企業のマーケティング部門の方やアナリティクス/レポーティングを担当している方に向け、Excel / PowerPointなどのOfficeソフトの使い方、分析の考え方、グラフの使い方、美しい資料の作り方、効率的な作業の進め方など、仕事に役立つ様々な情報を少しゆるめに発信していきます。

Author:医療情報総合研究所(JMIRI)について

医療情報総合研究所 JMIRIは、まだビックデータという言葉が無いころに日本で初めて処方情報データベースの運用・分析を開始した、処方情報分析のリーディングカンパニー。これまでに累計数十万ページ規模の分析レポート/グラフを製薬企業に向けて作成/提供してきました。

[詳細]


お問い合わせ

arrowup

mail