データセット&分析レシピ

独自指数「キャベツ指数」を作成する

指数の作り方(2)

2015.11.18小谷 祐一朗=おたに代表取締役

消費データ Excel 可視化

指数の作り方シリーズの第2回。独自指数を作ることは見た目は簡単だが、実際は簡単ではないし、正解があるものではない。折れ線グラフや散布図を作成して傾向を把握し、数値から情報を深く引き出せるかどうか試行してみよう。

分析の素材
分析に使うサンプルデータ:家計調査日別品目分類(キャベツ:2015年04月及び2015年05月)データ
分析に使うソフト:Excel
分析方法:-

 前回の記事では、指数の基本と注意すべき点について述べた。派手なものではないし、統計手法を用いた分析とは異なる。しかし、良い分析者とは、数学的に高度な手法や高価なソフトウェアが使えるか否かではなく、数値の指し示す意味を説明できること、つまり数値から情報を深く引き出せる者だと筆者は考えている。

 独自指数を作ることは見た目は簡単だが、実際は簡単ではないし、正解があるものではない。ただ、誰にでもわかりやすい算式で数値の表す本質を探ることはクリエイティブである。本稿では、前回のデータを引き続き使用し、キャベツへの支出と全体の消費支出を使用して実際に独自指数を作成してみよう。目的は、キャベツの支出はそれ以外の財・サービスへの支出とどの程度異なるかを知ることだとする。

 まずは、消費支出とキャベツへの支出の双方をグラフにしてみよう。次のようになる。

 このままでは、消費支出にキャベツへの支出が含まれているため、目的には合致しないい。また、単位は円ではあるが、極端に桁数が違うため比較し難い。まずは、消費支出からキャベツへの支出を差し引き(キャベツ以外への支出 = 全体の消費支出 - キャベツへの支出)、4月1日を基準として比較を容易にしよう。グラフは次のようになる。

 キャベツへの支出とキャベツ以外の支出の変化が似ている日とそうでない日があることに気づく。散布図を描くと次のようになる。

 縦軸がキャベツ以外の支出、横軸がキャベツへの支出である。正の相関関係がありそうだが、線形の単回帰分析とは若干異なるであろうことも推察できる。ここで、キャベツ以外への支出を分母、キャベツへの支出を分子としてみよう。この場合、1を超えれば、4月1日に比べて、キャベツ以外への支出よりキャベツへの支出は大きくなりやすいタイミングであることを示す。

 グラフは次のようになる。

 全ての日において1を超えていることがわかる。これは様々な解釈ができるものであるが、まずキャベツというのは非常に値動きの激しい(葉物)野菜の一つであり、季節に応じたキャッチコピーを考えることもできる商品である。こういった数値が生成される背景である経済的な視点を考えることも指数作成時には必要である。

 本稿では、独自指数の作成を行った。複雑な統計解析は全く必要としないが、計算式の一つ一つを定義し、数値の背景を考えることで、インサイトが得られる独自指数を作成することができる。高度な手法を使いこなすことも必要だが、数値の意味付けや背景を考えられるかも分析者としては大切なことである。

印刷

日経ビッグデータの最新号

3月号特集

オンリーワンデータで成長戦略を描く

現場に出向けば、価値あるデータを創出できる

年間購読のご案内

申し込む

お問い合わせ

日経ビッグデータのサイトへ

本サイトは更新を終了しました

 「日経ビッグデータ」は2018年4月2日、「日経クロストレンド」に名称を変更しました。データ活用やAI関連の最新記事は日経クロストレンドでお読みください。

 本サイトは更新を終了し、19年3月31日に閉鎖する予定です。長い間のご利用、ありがとうございました。