患者中心の保健医療を支える
処方情報分析のリーディングカンパニー

 03-3239-6840

厚労省のデータで、性別x傷病分類で切替可能な、年齢別ヒストグラムを作ってみよう(前編)

time 2017/01/30

※解説記事内の画像はExcel 2010のものです。

Excel中級者のみなさま、こんにちは (´▽`)/

今回は厚生労働省(厚労省)からダウンロードしたデータを使って、こんなものを作ってみました。

ministry001

このグラフ、ちょちょいのちょいで、性別と疾病分類が、簡単に切り替えられるんです。

ではちょっと、性別を「男」に変えてみましょう。

ministry002

さらに、疾患を「呼吸器系の疾患」に変えてみましょう。

ministry003

いかがでしょうか?

これがあれば、性別x疾患を自由に指定して、年齢分布を確認することが可能です!( ̄▽ ̄)b

このツールには、Excelの便利機能の、いろんな要素が詰まっています。

一緒に作ってみて、一気にExcelスキルを上げてしまいましょう。

そもそも厚労省のデータって、こんな感じ

この元データは、厚労省が発表している「患者調査」よりダウンロードした、CSVデータです。

e-Statというところから、簡単にダウンロードできます。

今回使用したのは、平成26年(2014年)の「総患者数,性・年齢階級 × 傷病分類別」というCSVデータです。

ministry019

そのCSVデータ、こんな感じです。テキストで開いてみると…

ministry004

……( ̄ー ̄;???

これじゃ一体なんなのか、わかりませんね。

ではExcelで開いてみましょう♪

ministry005

ちょっとマシになったでしょうか?

……でも、やっぱり数字の羅列じゃわかりづらいですね。

そんな時に、グラフなら一目で、どの年代に患者さんが多いのか知ることができます。

ministry006

これならプレゼンの資料にしても、バッチグーですね。( ̄∇ ̄*)

厚労省「患者調査」について、基本知識

本題に入る前に、この「患者調査」のデータとは一体どんなデータなのか、調べてみました。

細かいことは厚労省のサイトを見て頂ければわかると思いますが、大雑把にまとめると、こんなところです。

  • 3年に1回、厚労省が行っている調査。
  • 全国から無作為に抽出された医療機関が対象。
  • 調査期間について: 入院・外来患者は、調査年10月中旬の3日間のうち、医療施設ごとに定める1日。退院患者は、9月1日~30日までの1か月間。
  • 総患者数とは、調査日において、継続的に医療を受けている者(調査日には医療施設で受療していない者を含む。)の数を算式により推計したもの。

CSVの構造を俯瞰してみよう

それでは早速、ツールを作ってみましょう。

e-StatからダウンロードしたCSV「j0062.csv」をExcelで開いてみます。

ministry005

ずずーーーっとズームアウトしてみます。

ministry007

これを色分けしてみると、こんな感じになります。

ministry008

  1. 紫:縦軸「疾患名」
    ここに、「Ⅳ 内分泌,栄養及び代謝疾患」とか「Ⅹ 呼吸器系の疾患」とか、書いてあります。
  2. 黄色:横軸「年代」
    「0歳」から「90歳以上」まで、5歳区切りで年代が書かれています。他に、「総数」や「不詳」(年齢不詳)、「65歳以上」「75歳以上」(5歳区切りではなく、その年齢以上すべての患者数になっている)などがあります。
  3. 緑:データ「総数」
    総数というと判りづらいですが、要は男と女の合計。縦軸×横軸の患者数が入っています。
  4. 青:データ「男」
    縦軸×横軸の男性患者数。
  5. 赤:データ「女」
    縦軸×横軸の女性患者数。

例えば、「Ⅳ 内分泌,栄養及び代謝疾患」かつ「60~65歳」の男性患者数を探したいときは、

1:紫「Ⅳ 内分泌,栄養及び代謝疾患」と、2:黄色の「60~65歳」が交わる、4:青のエリアを探すと、「346」人 …という感じで入っています。

試しにグラフを作ってみよう

じゃあ試しに、一番左上のデータを使って、ヒストグラムを作ってみましょうか。

Excelシートをもうひとつ開いて、グラフに必要な部分だけ、コピーしてきます。

紫の縦軸(疾患をひとつ)と、黄色の横軸(総数の部分のみ)と、緑の総数をコピーしてきました。

(コピー範囲… A3:Z6)

ministry009

ministry010

いらないところをカットしていきます。

(削除範囲… 3行目、X:Z列)

ministry011

ministry012

それでは、グラフにするデータを選択して、「挿入」→「縦棒」→「2-D縦棒」。

(グラフ範囲… A2:W3)

ministry013

できた!……でも、なんだか変?(・・;)

ministry014

ああ、総数が入ってしまっていますね。

総数をグラフから除きましょう。

グラフを選択すると、現在のデータ範囲に枠が出ます。

これをドラッグして、総数を範囲から除いてしまいましょう。

(系列値の範囲… B3:W3 → C3:W3に変更)

ministry015

ministry016

基本のヒストグラムができました。

見た目を整えていきます。

ministry017

ひとつひとつ説明すると時間がないので、ここでやったことを列挙します。

  • 「グラフの移動」で、グラフをグラフシートに移動
  • プロットエリアの大きさ変更
  • 好みのフォントに変更
  • 凡例を消す(今回はデータ系列が1種類だけなので…)
  • データ系列の要素の間隔を30%にする
  • 軸の書式設定で、線の色を「線無し」にする

でも、最初のグラフと比べると、何か足りないような…。

そうそう、最初のグラフは「総数」の数字を、右上に入れていました。

それにこのグラフ、縦軸の数字の単位も分からないです。

ではこのふたつを、「挿入」→「図形」→「テキストボックス」で挿入します。

単位も総数も、とりあえずテキストとして書いておきましょうか。φ(..。)

ministry018

これでやっと、グラフの形が整いました。

ツールは次回に!

今回は疲れたのでこの辺で(;´▽`A

次回はこの基本のグラフをちょっといじって、軸を自由に変えられるようなツールを作ります。

See you !(* ̄▽ ̄)ノ~~

中編へ移動

タグ

このブログについて

このブログ(JMIRI Office部)は、製薬企業のマーケティング部門の方やアナリティクス/レポーティングを担当している方に向け、Excel / PowerPointなどのOfficeソフトの使い方、分析の考え方、グラフの使い方、美しい資料の作り方、効率的な作業の進め方など、仕事に役立つ様々な情報を少しゆるめに発信していきます。

Author:医療情報総合研究所(JMIRI)について

医療情報総合研究所 JMIRIは、まだビックデータという言葉が無いころに日本で初めて処方情報データベースの運用・分析を開始した、処方情報分析のリーディングカンパニー。これまでに累計数十万ページ規模の分析レポート/グラフを製薬企業に向けて作成/提供してきました。

[詳細]


お問い合わせ

arrowup

mail