データセット&分析レシピ

指数の基本、最も大事なのは基準日を決めること

指数の作り方(1)

2015.11.17小谷 祐一朗=おたに代表取締役

消費データ 可視化 Excel

日経平均やTOPIXなど公のようなものもあれば、デイトレーダーなどが自らの売買基準に使用するものまで、様々な指数(インデックス)がある。指数とは「基準時点に基づき重み付けされた指標」であり、情報を計算によって意味付けしたものである。本稿では、指数とその作成方法について考えていきたい。

分析の素材
分析に使うサンプルデータ:家計調査日別品目分類(キャベツ:2015年04月及び2015年05月)データ
分析に使うソフト:Excel
分析方法:-

 指数(インデックス)の最も簡単な作り方で、政府の物価統計でも使われているのは「ラスパイレス算式」である。計算式は次のようになる。

(調査時点の価格×基準時の数量)÷(基準時の価格×基準時の数量)

 数量が1であれば、調査時点の価格を基準時の価格で割っただけである。「割る」というのは、逆数をかける、つまり重み付けをしている、ということである。つまり、指数は「基準時点に基づき重み付けされた指標」であり、情報を計算によって意味付けしたものである。本稿では、学術的な定義等の厳密さは多少犠牲にして、指数とその作成方法について考えていきたい。

 指数を作成する際に、最も大事なのは基準日を決めることである。基準日の決め方で指数の持つ意味合いは全く異なってくる。例えば、「会計年度等において重要な日」を基準日とした場合は会計の視点からデータを見るものであり、「データの持つ意味において重要な日」を基準日とすれば、データドリブンな視点となる。ここでは基準日を2015年04月01日の場合と、最大値を基準とした場合の双方を作って、実際に比較してみよう。

 まずは、こちらから、家計調査の消費支出をダウンロードする。

A列に月、B列に日、C列に消費支出全体があり、D列にキャベツ、E列にたけのこ、F列に豚肉 の消費支出がある。

 次に、実際にキャベツの支出額から指数を作成してみよう。H列に4月1日の支出額で割ったものを、I列に最大値で割ったものを入力してみよう。なお、 D列の41行目がキャベツの支出額の最大値である。次のようになる。

 グラフを描くと以下のようになる。

 これが最も単純な指数である。

 基準日はどちらも1になる。ただ、最大値を基準にした方が、変動幅は小さいと考えられる。実際に平均値と標準偏差をAVERAGE関数とSTDEV.S関数を用いて、算出すると次のようになる。

 当たり前ではあるが、平均値と標準偏差の双方が異なることがわかる。ここで、厳密な等分散性の検定などは抜きにして、標準偏差が異なることの意味について考えてみよう。

 まず、標準偏差が小さいことは変動幅が小さいことを意味する。反対に、標準偏差が大きい場合は、変化が大きい。最大値を基準にしたものが前者、4月1日基準のものは後者である。どちらの方が良いということもないが、変化に伴い何らかの施策を行う場合(例えば仕入量の増減)は、標準偏差等の変動幅を示す指標が大きい方が変化に敏感であり、きめ細かな対応につなげることもできるであろう。

 本稿では、最も簡単な指数の計算式を参考にし、2つの指数を作成した。当たり前だが、基準日の選び方によって、指数の持つ意味合いが異なる。大事なことは、指数を作成する目的は何かを考え、それに則した変動幅について考えることである。これは派手さはないが、実際に指数を作成する際や読み解く際、あるいは数値の意味を読み解く際に、注意すべき重要な点だと言えよう。

印刷

日経ビッグデータの最新号

3月号特集

オンリーワンデータで成長戦略を描く

現場に出向けば、価値あるデータを創出できる

年間購読のご案内

申し込む

お問い合わせ

日経ビッグデータのサイトへ

本サイトは更新を終了しました

 「日経ビッグデータ」は2018年4月2日、「日経クロストレンド」に名称を変更しました。データ活用やAI関連の最新記事は日経クロストレンドでお読みください。

 本サイトは更新を終了し、19年3月31日に閉鎖する予定です。長い間のご利用、ありがとうございました。