日経BigData

キーパーソン

深層学習の利用環境は劇的に安価に、今後は教師データの価値が高まる

本誌読者セミナー「ビッグデータ活用 2018年の焦点」報告(3)

2017.09.20吉川 和宏=ライター

将来は機械学習における学習コストが劇的に下がる一方で、教師データの入手に大きなコストを要するようになる――。こう予測するのは、野村総合研究所の未来創発センターを率いる桑津浩太郎氏だ。9月4日、日経ビッグデータ主催の読者セミナー「ビッグデータ活用 2018年の焦点」において、「AI活用における知財の急所、各産業の教師データやモデルをどう扱うべきか」と題して講演した。

 現在、企業がビジネスで深層学習(ディープラーニング)を利用しようとすると、高価な専用ツールを導入することが必要だ。従量料金のクラウドサービスもあるが、ビジネスで利用しようとするとデータ量が膨大になり、利用料金が跳ね上がってしまう。

 桑津氏は、こうした学習コストが急激に下がると予測する。引き合いに出したのが計算コストだ。計算のためのツールは、そろばんから電卓、コンピュータへと変遷してきた。「人件費のかかる社員がそろばんを叩いていた時代と比較すると、最新のCPUの計算コストは限りなくゼロに近い」と指摘。深層学習も、これと同様な状況になると予測する。「10年ほどすると深層学習のツールを利用するコストも、現在の感覚でいうと無償に近い状況になる」と語る。

野村総合研究所 研究理事、未来創発センター長の桑津浩太郎氏
Photo by Katsunori KUWABARA

教師データの入手が困難な時代に

 同氏は、「学習コストが無償になると、深層学習の学習プロセスで教師とするデータの価値が高まってくる」と分析する。

 深層学習の成功例として、猫の画像を認識できたといった事例が紹介されているが、こうした取り組みの教師データは、ほぼ無償で収集可能だ。猫や犬などの動物の写真を集めればよいからだ。

 しかし、深層学習をビジネスで活用する場合には、教師データの収集は容易ではない。同氏は、こうした例として、特許事務所におけるサーチャー(特許検索者)のケースを紹介した。目的の特許案件にたどり着くための効率的な検索条件を深層学習で見いだす取り組みだ。

 この場合は、サーチャーの検索プロセスが教師データとなる。しかし、これはサーチャーのノウハウであり、サーチャーという職の付加価値なので、第三者に公開したくない。もし、これが深層学習によってシステム化されてしまえば、自分が職を失うことになるかもしれないからだ。

 先行する北米のAI研究活動では、医師や弁護士/判事、研究者、パテント分析家などから、AI研究に際してデータの提供を拒否、もしくは高額なロイヤルティーを求められるケースが増えているという。さらに、教師データの市場流通、仲介、評価・格付けなどを、新たなベンチャービジネスとして模索する動きもあると指摘する。

深層学習のビジネス利用に2つのモデル

 桑津氏は現在、深層学習をビジネスに利用するモデルとして、「OTTモデル」と「OSSモデル」という2つの流れがあると分析する。

 前者は、OTT(Over The Top=グローバルにサービスを提供する大手ネット事業者)が提供する、深層学習のクラウドサービスの利用を前提としたモデルで、「現在、主流となっているモデル」(桑津氏)だ。

 OTTは、このプラットフォーム上で問題解決モデルの生成だけでなく、稼働や管理に伴うエコシステムを漏れなく押さえることを目的としている。エコシステムの維持のため、極めて低い基本利用料を設定してロックインを図る。他分野への展開についても、エージェントとして仲介料を取りつつ、マッチングや開発支援のためのユーザー団体を形成していく。

 これによって、「プラットフォームの利用は安価。ただし、派生モデルの収益や利用権などはベンダー側が管理」「派生モデルなどを展開したいならば、プラットフォーム利用料は増加」「同一プラットフォーム上での、他社モデルの利用や連携を支援。多く利用されれば高く評価して、費用などを還元」などが予想されるという。

 後者のモデルはOSS(オープン・ソース・ソフトウエア)を前提とした深層学習プラットフォームを利用するものだ。このモデルでは、利用者が一定の条件下で平等にソースコードにアクセス可能となる。その改変や頒布もより広く認められる。ビジネスモデルの視点では、深層学習そのものの機能による付加価値の囲い込みは困難となるが、より多くの開発者に門戸を広げることになる。

 ただし、このモデルは多くの参加者が自発的に開発や機能追加などを継続的に行うことを前提としており、桑津氏は「モデルが成立するまでに『これは使える!』といった評判や盛り上がりが欠かせない」と指摘する。開発者のすそ野の広がりも必要であり、OTTモデルに比較して出足が遅くなるという。

* * *

 本セミナーは専門レポート「AI・IoT・ビッグデータ総覧 2017-2018」の発行を記念して、寄稿者、取材先の協力を得て実現した。同総覧は、150以上のケーススタディや15分野のIoT活用、100以上のAI活用支援ベンチャー調査などで構成している。