日経BigData

データが創る未来

ゲームのルールを教えなくても人工知能は人間を打ち負かせるか

世界を変える論文 第1回

2014.05.14白ヤギコーポレーションCEO 柴田 暁

本連載は様々な企業や大学が発表した論文の中から、企業におけるビッグデータ活用推進のヒントになるようなユニークなアイデアを紹介していく。著者は、情報サービス「カメリオ」の運営やビッグデータコンサルティング事業を手掛ける白ヤギコーポレーションの柴田暁CEO(最高経営責任者)だ。

「そんなことは教えていません!」(イラスト提供:白ヤギコーポレーション)

 「雨の日に水色の服を着たカップルは月末になると朝食にファストフードを食べる可能性が高い」。もしそんな複雑なパターンを機械が自ら見つけられるようになったら、私たちの仕事やビジネスに与える影響は計り知れない。

 「知性とは何か」。宇宙の始まりの謎と並ぶくらい大きな問題だ。人工知能(AI)の探求はコンピュータの黎明期から進められてきたが、最近になって人工知能研究への本格的な投資が相次いでいる。2013年に米グーグルとNASA(米航空宇宙局)が共同設立した「量子人工知能研究所(Quantum Artificial Intelligence Lab)」をはじめとして、米フェイスブックや米ヤフーなどのネット企業大手が人工知能の研究所を設立したり、人工知能分野の専門会社を買収したりする動きが盛んだ。

 ニューロン(神経細胞)やシナプシス(接合部)といった脳の構造に着想を得た機械学習の技術として、人工ニューラルネットワーク(ANN)がある。改良を重ねるうちに、実際の脳の仕組みとは乖離してきたが、かつてより手書き認識や音声認識で優れた能力を発揮することが知られている。私の以前の研究分野であった素粒子の分析においても、観測された粒子を分類する目的で人工ニューラルネットワークの技術がよく使われていた。

群を抜く予測精度を発揮するディープラーニング

 一方で、人工ニューラルネットワークに汎用性の高い問題解決能力を持たせるには、脳神経でいうところのニューロンとシナプスが何段にも及ぶ深い階層構造を作り、高い複雑性を持つモデルが必要である。しかしながらモデルの複雑性を高めると、学習させるために必要なデータが膨大になってしまう。この問題を克服する鍵となる技術の1つが、ディープラーニング(深層学習)だ。ディープラーニングはモデルの学習方法に革新的な工夫をすることで、ニューラルネットワークの利用価値を大きく高め、様々な分野で群を抜く予測・分類精度を発揮している。

 ディープラーニングを巡る大変面白い論文があるので紹介したい。論文のタイトルは「深層強化学習でアタリのテレビゲームをプレイする(Playing Atari with Deep Reinforcement Learning)」。この論文は2011年に英国で設立されたディープマインドが発表し、同社が大きく注目を集めるきっかけとなったものだ。同社は2014年1月にグーグルが買収している。1977年に発売され、初めてROMカートリッジを使った家庭用ゲーム機として一世を風靡した「Atari 2600」のゲームを、人工知能にプレイさせるとどうなるのか? しかもルールの説明は一切なしで。

 テレビゲームを人工知能にプレイさせるという人目を引くテーマに加え、この論文研究の凄いところは、元来人工ニューラルネットワークが得意としていたパターン認識・分類の領域を超え、現在の状態に基づいて次の行動を選択する「強化学習」を可能にしたことだ。汎用性の高い学習モデルに、人間がゲームをするときと同じインプット(画面のグラフィックと得点)だけを与えて、時には人間をも凌ぐプレイヤーに育て上げたことが、非常に高い技術力のデモンストレーションになった。

 最先端の人工知能の実力はどの程度のものか?私は今までアタリのゲーム機をプレイしたことが一度もなかったが、Atari 2600のエミュレータを使い、論文で結果が報告されている「Q*bert」と「Seaquest」というゲームをプレイしてみた。ディープマインドの人工知能である「DQN」はQ*bertで最高4500点、Seaquestで1740点を出したとされる。

 ルールは見ないという同じ条件で私がそれぞれ15分ほどプレイしたところ、Q*bertでは8000点、Seaquestでは2500点を出した。私はテレビゲームは基本的に時間の無駄だと思っているような人間なので、人並み以上の技術を持っていないことには自信がある。どうしたディープマインド? 今回DQNが特にいい得点を叩きだしたゲームは、エミュレータ上で動かすことができなかったが、それにしてもこのあっけなさ…。

データサイエンティストさえ、職を失う日が来る?

 ゲーム結果はさておき、この研究のポイントはDQNが非常に汎用性の高い人工知能だということだ。米IBMが開発した「ディープブルー」というコンピュータがチェスの世界チャンピオンを破ったことが広く伝えられているが、そのアルゴリズムはチェス以外のことは一切できない。一方で、DQNはゲームのルールはおろか画面上の物体を認識する方法も事前には組み込まれておらず、それら全てを自ら学ぶことのできる、まっさらな学習機械だった。この技術をさらに進化させていくことで、人間と同じように、非常に多岐に渡る知恵を自ら学ぶことができることは想像に難くない。

 人工知能が人間に奴隷扱いされることに苦情を言う日はまだ当分来ないようだが、コンピュータのパターン認識能力は飛躍的に進歩しつつある。ビッグデータの時代にあって、この進歩には大きな意味がある。一つには、膨大なデータから人間には見つけることのできない複雑で、目立たないパターンを見つけ出すことだ。人間の目にはノイズの集まりにしか見えない退屈なデータの中に、実は驚くべきパターンが潜んでいるのを自動的に見つけ出すかもしれない。

 ビッグデータ時代の機械学習において、もう1つ重要なことは、人工知能に学習させるために必要なデータが豊富にあるということだ。解きたい問題に特化したモデルを作ることには、データサイエンティストの高度な知的能力が問われる。だが、大量のデータを汎用性の高いモデルに与えてやることで自動的に問題解決できるようになれば、どうだろう。今は人気のデータサイエンティストさえ、職を失う日が来るだろうか?

柴田 暁(しばた あきら)
ロンドン大学クイーンマリー校で実験素粒子物理学博士号を取得。ニューヨーク大学研究員、ボストン・コンサルティング・グループでの戦略コンサルティングを経て、現在、情報サービス「カメリオ」の運営やビッグデータコンサルティングを手掛ける白ヤギコーポレーションにてCEOを務める