達人に学ぶ課題解決

実務で使う分析手法は5つで十分、マーケッターこそデータサイエンティスト候補

2015.06.24渋谷 直正=日本航空

第2回データサイエンティストオブザイヤーにも輝いた、日本航空Web販売部の渋谷直正氏による3回の連載講座。渋谷氏は「企業のマーケティング担当者は自ら分析できるようになったほうがいい」と語る。

 「明日からデータサイエンティストになってください」──もしあなたがこんな風に会社から命じられたらどうすればいいだろう。あなたは専門職でも技術者でもなく、一般の事業会社の企画部門に所属するマーケッターだと考えてほしい。

 たいていの人は、「分析の手法を知りません」「文系出身なので・・・」と言って尻込みするかもしれない。「データサイエンティスト」という言葉には統計学の博士号を持っていて高度な分析をする専門家というイメージがある。確かにそんな専門家もいるが、私はマーケッターの人たちこそ分析を武器にしてビジネスで成果を出せるし、そうすべきだと考えている。

 どんなに分析スキルがあっても、ビジネス課題をきちんと把握していなかったり、問題解決への熱い思いが欠けていたりすると、単なる「分析のための分析」や「自己満足の分析」に終わって、良い結果につながらない。そして何よりもその業務に対する深い知識や経験がないと、データの解釈も表面的なものになってしまう。

 その意味で日々ビジネスに接して企画業務を行っているマーケッターこそ、データサイエンティスト候補として最適だ。言い換えると、「自分で分析ができるマーケッター」を育てることが、企業の分析力を高める正攻法なのだ。この連載で、マーケッターが分析力を身につけて実務に生かせるようになるためのヒントを提供したい。

最初にグラフを描く

 分析すべきデータがそろったら、最初にグラフを描くことから始めよう。Excelなどに数字が並ぶと、いきなり平均値を求めて、そこから思考を始める人が多い。少し統計を学んだ人は、標準偏差や中央値、四分位範囲も出すかもしれない。しかし、このような要約値にしてしまうと消されてしまう情報がとても多い。連続値のデータなら、必ずヒストグラムを描こう。分布を目で眺めると、偏りや規模感、極端な外れ値などが一目瞭然となる。

 マーケティングで出てくるデータはきれいな正規分布をしていないのが普通である。平均値や標準偏差は当てにならないし、2山の分布であれば中央値でも把握できない。グラフで見るのが一番簡単で効率的だ。

 2変数の場合は、双方が連続値であれば必ず散布図を描くこと。一方が性別や既婚・未婚のようなカテゴリカル変数の場合は、箱ひげ図(箱で中央値や四分位を示し、箱の両側から伸びるひげでデータの広がり方を示す)や複数のヒストグラムを描く。双方がカテゴリカル変数の場合はクロス集計表だ。

分析の8割を占めるもの

 マーケティングで使うデータはカテゴリカル変数のものが多いので、クロス集計は特に重要だ。クロス集計をする際のコツは、できるだけ単純な形にすること。望ましいのは2×2の表に落とし込むことだ。下の図は、Webサイトでの商品Aを説明する特集ページの閲覧有無と商品Aの購入有無の人数をクロス集計表にした例だ。

クロス集計表はさらなる分析の出発点

 クロス集計表はさらなる分析への出発点だ。例えば、購入に至らなかった原因を探る手がかりを与えてくれる。「特集ページを閲覧した後、購入フローに進んだ人は多かったのか。それとも少なかったのか」「購入フローに進んだ人が少なかったのなら、原因は何か」というふうに、検討すべき課題が次々に浮かび上がる。

印刷

関連記事

日経ビッグデータ関連記事

日経ビッグデータの最新号

3月号特集

健康にも
第4次産業革命

ビッグデータ、AI、IoT活用で、健康関連の26兆円市場が動き出す

年間購読のご案内

申し込む

お問い合わせ