統計・分析を極める

【連載第1回】ほとんどの分析はなぜ不毛に終わるのか、失敗の原因を見つめることから始めよう

2014.07.31ヤフー チーフストラテジーオフィサー 安宅 和人

ヤフーのビッグデータ戦略を担当する安宅和人チーフストラテジーオフィサーは20年以上分析に関わってきた。ほとんどの分析が同じような理由のために失敗を繰り返しているという。

 私はこれまで20年以上にわたり、様々な分析とともに生きてきた。その経験の中から言えることが1つある。それは、この世の中で日々生み出されている分析の大部分が、意味のある意思決定や変化を何も生み出さないということだ。世の中で生み出される分析のほとんどが、結果の視点から見るとダメ分析なのだ。

こんなダメ分析が世の中にあふれている!

 私自身が仕事を始めたころに行った分析も今振り返ればそうだったし、これまで接してきた事業分析やビッグデータ分析の多くもそうだった。

 そこに費やされている労力、才能、コストを考えれば、あまりにも残念なことだ。この連載は失敗の原因を見つめることから始めたい。

 では、ほとんどの分析はなぜダメ分析なのか? 原因は大きく5つある。

(原因1)「何のために」がない


 最も多いのが、このパターンだ。具体的には、次のようなケースだ。

・ただデータを並べて触っていれば何らかの意味合いが生まれてくると思っている
・なんとなく思いついた型の分析を始めてみるが、着地できない
・目的がはっきりしないまま数字をこねくり回している
・そもそも言いたいこと、検証したい仮説がない

 胸に手を当てて過去に思い当たることのない人はほぼいないだろう。しかし、「何のために」がはっきりしないものは、よほどセンスの良い人がそこにいない限り、そもそも分析として意味を持ちようがない。

 ビッグデータや定量調査データなど、まとまったデータがあると、そのデータを処理しているうちに何か意味が生まれてくるかのような誤解があるが、それは大きな間違いだ。

 データの項目が多いほど「何が目的関数なのか」「何に決着をつけるためにデータを分析しているのか」や、「何を言えばいいのか」が見えていないと、データに溺れ、無駄な集計が多発する。何のために、何に答えを出すべきか(イシュー)を考えずに、闇雲に分析するというアプローチではダメなのだ。

(原因2)分析の軸が不適切

 「分析の軸」に重大な問題があるものも多い。例えば、以下のようなケースだ。

・データの入手しやすさやそのデータを扱い慣れているという理由だけで分析軸を選んでいる
・判断に必要なコントロール(対照条件)が取られていない
・軸の取り方にダブリや漏れがある
・軸の中の刻みがおかしく、意味合いを正しく導き出せない

 では「分析の軸」とは何か? これを理解するには、まず「分析とは何か」について正しく理解する必要がある。分析とは「分けること」「数量的に何かを調べること」というふうに考えられがちだが、これは誤りだ。分けない分析、数値が出てこない分析などいくらでもある。

 私の答えはシンプルだ。分析とは、一言で言えば比較、すなわち比べることだ。分析とは、フェアに比較できるもの同士を比べ、違いや関係を見ることなのだ。

 「比較」が言葉に信頼を与え、論理を成り立たせ、問いに答えを出す。暴論と大胆な分析の差は、事実に基づく、ちゃんとした比較があるかどうかということにある。

 比較のための条件側の軸、あるいは評価側の軸が「分析の軸」だ。これにダブリや漏れがあったり、目的に沿ったものになっていなかったりすれば、イシューに沿っていても分析として失敗するのは当然だ。

(原因3)データに問題がある

 扱っているデータそのものに問題があるケースも多い。典型的には次のようなものがある。

・分析対象が決め打ちされている(母集団に抜けや漏れがある)
・そもそもデータが汚れていたり、歪んでいたりする(サンプリングやデータ取得に由来する問題)
 分析者にどれほど優れた問題意識があったとしても、またどれほど素晴らしい分析の軸選びをしたとしても、取り扱うデータが汚ければ分析をする意味がない。

(原因4)異質なものの比較

 分析をダメにする原因はさらにある。目的も明確、分析の軸も適切、データに問題がなくても、論理的にやってはいけないことをやっているケースが意外と多い。具体的な例としては、次のようなものがある。

・本来比較できないものを比較している
・本来足し合わせることができない値を足している

 これらは定義の異なる数字を混同するために起こる。ちょっと信じがたいかもしれないが、高い教育を受けた人でも、理系の訓練をしっかり受けていないと、それなりの頻度でこうした間違いを犯す。

 このような間違った比較が分析に混じっていると、検討の全ての信用が台無しとなり、過去のデータに至るまで見直しを迫られる。

(原因5)解釈が間違っている

 ダメ分析を生む最後の原因は解釈の間違いだ。

・導き出された数字からは言えないことを言っている
・素直にデータを解釈していない
・異常値を拡大解釈している
・決着がついていないのに決着がついたと勘違いする

 これらは全て解釈の間違いだ。世の中で生み出される分析の結構な割合が、実はこの間違いを犯している。

 「こうあってほしいという気持ち」や「そもそもの思い込み、仮説」に引っ張られてしまうことが原因のことが多い。比較の結果を素直な目で見ることができなくなってしまうのだ。

 「比較が終わってしまえば、どうにでも解釈できると考え自分の言いたいことを言う」のは悪質なケースだが、珍しくない。

 「何をどこまで結論として言えばいいのか」について分析者が分かっていないこともある。

 以上見てきた通り、分析力の強化にまず必要なのは、統計やプログラミング言語の知識ではない。統計や分析ツールの働きを正しく理解することは確かに重要だ。だが、分析のプロセスを適切に設計することの本質は統計や分析ツールの使い方とは別のところにある。

 次回(月1回掲載、次回は8月)はこのことを踏まえ、優れた分析を生み出すためのポイントについて紹介する。

印刷

関連記事

日経ビッグデータ関連記事

日経ビッグデータの最新号

8月号特集

「眼」が拓く深層学習ビジネス

保険見積もりを10分で作成、物流センター省人化、ロボットで顧客分析…

年間購読のご案内

申し込む

お問い合わせ