• BPnet
  • ビジネス
  • IT
  • テクノロジー
  • 医療
  • 建設・不動産
  • TRENDY
  • WOMAN
  • ショッピング
  • 転職
  • ナショジオ
  • 日経電子版

ビッグデータで英語が話せる?

複雑な事象を科学する突破口

2013年9月30日(月)

  • TalknoteTalknote
  • チャットワークチャットワーク
  • Facebook messengerFacebook messenger
  • PocketPocket
  • YammerYammer

※ 灰色文字になっているものは会員限定機能となります

無料会員登録

close

日経ビジネス9月30日号の特集「日米最新事例 ビッグデータ 本当の破壊力」では、最新のデータの活用事例を紹介したうえで、「プライバシーに関わる情報の保護」と「社会全般の利便性向上」のバランスをどう取るかという課題に焦点を当てた。このコラムではそれに連動し、誌面には収めきれなかった視点や事例を紹介していく。

 突然だが、私は英語が得意ではない。旅行先での日常会話程度なら何とかなるが、言葉の微妙なニュアンスまで汲み取って記事にするような必要がある記者という職業においては、十分に通用する英語力を持ち合わせていない。なんとかしなければ、と思ってはいても、さしたる努力もできぬまま日々を過ごしている。

 それでも、業務で英語の資料を読まなければいけない時もある。時間がたっぷりあれば、勉強がてら辞書を引いて訳すことも不可能ではないかもしれないが、なかなかそこまでの余裕はない。

 そんな時に多用するのが、米グーグルが提供している自動翻訳サービス「グーグル翻訳」だ。私と同じく、英語(外国語)に苦しむ企業人の方々であれば、おなじみかもしれない。

 サイトの入力窓に、コピーした英語の文章を入れる。すると、すぐさま右側の窓に日本語訳が表示される。大抵の場合多少の不自然さは残るが、大意を取るには困らない水準の訳が瞬く間に表示される。正直言ってありがたい。

 なぜ急にこんな個人的な話を持ち出したのかと言うと、このグーグル翻訳こそが、「ビッグデータ」の活用事例の中で、私自身が今最も恩恵を受けているものだと思うからだ。

グーグル翻訳の革命

 2006年、グーグルは米国の国立標準技術研究所(National Institute of Standards and Technology、NIST)のコンペティションで、機械翻訳の世界に衝撃をもたらした。

 当時、機械翻訳技術で主流にあったのは「ルールベース型」と呼ばれる手法。これは大人が外国語を習得するのに似て、言語ごとに異なる単語や構文の法則を徹底してプログラム化し、それに沿って言葉を訳させるというものだ。

 それに対して、グーグルが用いた手法は違った。学術書の類や国際連合をはじめとする国際機関の様々な書類など、2カ国語以上に相当な精度で訳されていると思われる膨大な言語資料を統計的な手法で処理。可能性として最も高いと考えられる訳語を、文法にかかわらず抽出するというものだ。

 グーグルはこの「データ基調型」というべき手法で、並み居るほかの機械翻訳プログラムを抑えてコンペティションに優勝した。

 この優勝の意味はとてつもなく大きかった。機械翻訳の技術に革新をもたらしたというだけではない。膨大なデータとそれを適切に処理する仕組みさえあれば、人間が知恵を絞って見つけ出した「法則」を使うよりもはるかに簡単に、そして精度も高く、難しい課題を解決できるという可能性を示唆したからだ。

コメント4

「ビッグデータ 本当の破壊力」のバックナンバー

一覧

「ビッグデータで英語が話せる?」の著者

中川 雅之

中川 雅之(なかがわ・まさゆき)

日本経済新聞記者

2006年日本経済新聞社に入社。「消費産業部」で流通・サービス業の取材に携わる。12年から日経BPの日経ビジネス編集部に出向。15年4月から日本経済新聞企業報道部。

※このプロフィールは、著者が日経ビジネスオンラインに記事を最後に執筆した時点のものです。

日経ビジネスオンラインのトップページへ

記事のレビュー・コメント投稿機能は会員の方のみご利用いただけます

レビューを投稿する

この記事は参考になりましたか?
この記事をお薦めしますか?
読者レビューを見る

コメントを書く

ビジネストレンド

ビジネストレンド一覧

閉じる

いいねして最新記事をチェック

日経ビジネスオンライン

広告をスキップ

名言~日経ビジネス語録

子会社とどう向き合うかで、その企業のガバナンスを判断できる。

牛島 信 弁護士