日本政府観光局(JNTO)によると、2016年の訪日外国人観光客数は推計で前年比21.7%増の2403万9000人となり、4年連続で過去最高を更新。政府は「2020年までに4000万人」の目標を掲げている。一方、言葉の問題が外国人旅行者の不満や不安に結び付いていることも確かだ。この課題解決に大きな貢献を果たすと注目を集めているのが、2016年12月にサービス提供がスタートした多言語音声翻訳サービスだ。開発チームにその機能と開発の狙い、多言語音声翻訳がもたらす未来について話を聞いた。

外国人旅行者に立ちはだかる言葉の壁

観光庁の調査では14年には日本を訪れた外国人の2人に1人が地方を訪問していることが明らかになるなど、インバウンドの経済効果は裾野まで拡大している。日本全体でおもてなしする体制を整えることが地方創生にもつながる一方、高齢化と若い人材不足の流れに歯止めがかけられない現場で、言語の壁が大きく立ちはだかる。総務省と観光庁が14~15年に行った調査では、訪日外国人旅行者が困ったこととして「無料公衆無線LAN環境(46.6%)」「施設などのスタッフとコミュニケーションがとれない(35.7%)」「多言語表示(20.2%)」が上位3つ。実際、災害などの緊急時に外国人をきちんと避難誘導できる体制をとる観光施設が多いとはいえない。

旅行中に困ったこと
訪日外国人旅行者が困ったこととして「無料公衆無線LAN環境(46.6%)」「施設などのスタッフとコミュニケーションがとれない(35.7%)」「多言語表示(20.2%)」が上位3つである。 ※訪日外国人旅行者の国内における受入環境整備に関する現状調査より http://www.mlit.go.jp/common/001115689.pdf

4つの言語で誘導や案内をするメガホン

いつも使っている母国語を話すと、自動的に外国語に翻訳され音声が発せられるーーそれはインバウンド効果で活況を呈するいまの日本に、もっとも必要な技術の一つだ。そして、その未来はいま、パナソニックの開発する多言語音声翻訳サービスにより現実化している。

メガホン型多言語音声翻訳機「メガホンヤク」の機能について紹介しよう。一言でいえば、空港やイベント会場などでお馴染みのメガホンに翻訳機能が付いたもの。マイク部分に向かってお決まりの案内などを日本語で話すと、あらかじめ登録された定型文が呼び出され、日本語、英語、中国語、韓国語と順番に繰り返し再生(拡声)する。必要な言語だけを選択することや再生言語の順番変更、再生音声の男性・女性のモード選択も可能。定型文は約300文が登録されており、キーワードから拡声したい文章を選択するワード選択機能も備えている。文章の中にある路線などを示す数字や、方向を示す上下左右なども変更でき、誘導や非常案内時に正確な翻訳でアナウンスすることが可能だ。空港や駅といった交通機関や展示会場、スポーツスタジアム、コンサートホール、テーマパークなど、外国人旅行者が大勢集まる場所で、スムーズな誘導や案内に貢献する。

「多言語音声翻訳をメガホンで」という発想は、どういった経緯から生まれたのか。同社のAVCネットワークス社イノベーションセンター 無線ソリューション開発部 システム3課の田中和之課長に開発の経緯を聞いた。

「訪日外国人数が一気に増えた2015年に、多言語音声翻訳のプロジェクトが立ち上がりました。緊急時などに、多くの外国人に対してメッセージを伝えるツールとしてメガホンを選び、開発を進めました。翻訳は、使用される場面できちんと伝わらなければ意味がないので、我々技術者が現場に足を運び、実際の使われ方から、担当の方々のお困りごとにも耳を傾けて開発しました。ホテルや旅館、観光案内所、空港、駅など多くの訪日外国人が訪れる約30カ所の施設の協力を得ながら実証実験を重ねています。その中で、外国人へのアナウンスが重要となる成田国際空港様などに高い関心を持っていただき、今回の『メガホンヤク』の実現化に至りました」(田中課長)

メガホンヤクの開発に関わったパナソニック AVCネットワークス社イノベーションセンター 無線ソリューション開発部の担当者。左から、菅原雅仁氏、田中和之氏、竹井良彦氏。

約98%という高い音声認識率で最適な翻訳を

「安全・安心の確保」の場合、緊急時などには通信の保証が担保できないことも想定される。そのため、「メガホンヤク」は単体で多言語音声翻訳できる機能を持たせ、交通機関やイベントホール、スタジアム、テーマパーク、観光地などで使われる特有の案内文を基本定型文として登録することにした。空港をはじめとする様々な現場で実証実験を行なった同課2係の竹井良彦係長は、実際に使用する場面で得られた様々な要望を一つひとつ地道に改善したと語る。

「現場の皆様からのご要望も多く、我々ももっとも注意を払ったのが音声認識です。緊急時などに誤認識してしまい、求める翻訳が出てこなくては意味がありません。多くの人の声を集め、我々技術者たちも1人何千回も発声して音声データを集めながら、約98%の認識率に高めました。騒音下でも正確な音声認識ができるようになりましたが、それでも間違った翻訳をしないよう、認識した日本語を液晶画面に表示し、誤りがないことを確認してから拡声するような仕組みにしています。ほかにも屋外使用に向けたご要望も多く、防塵・防水設計にし、日差しの強いところでも見やすいよう液晶画面を調整するなど、多様な現場ニーズを最大限に汲み上げた仕様になっています」(竹井係長)

屋外の日の当たる環境でも見やすいように調整された液晶画面。定型文を呼び出したり、正確に翻訳されていることを確認したりするのに役立っている。

誰でも簡単に操作ができることが大切

緊急時にこそ「誰でも簡単に操作ができる」ことが重要だということも現場からの声で分かった。持ち手の録音ボタンを人差し指で押して、拡声したい文章を音声入力すれば瞬時に音声照合・翻訳を行う。あとは拡声ボタンを押すだけで音声が出力されるので、初めて使う人でもスムーズに使用できる。定型文の管理や更新、ソフトウエアのアップデートなどはクラウドサービスで提供する。また、施設の特有の名称や文章が必要な場合も、同サービスで定型文の追加ができる。

メガホンヤクは自立可能なため、再生ボタンをロックして置いておくことで、人がいなくても繰り返し拡声させることができる。

ハードウエアの設計を担当した同部4課の菅原雅仁係長は、今回の開発で「コミュニケーションの成立」について考え続けたという。

「同一言語での会話でも意図にそぐわない表現をしてしまったり、誤解があってもそのままなんとなく会話が進んでしまったりすることがよくありますが、やはり音声を補う表示があった方がコミュニケーションの正確性が高まります。上に避難させるつもりが下に誘導してしまっては命に関わることになりますから、『メガホンヤク』では音声入力を一度表示文で確認するステップを設けました。内容をきちんと確認してから翻訳することで、正確な情報を発信できます。音声認識についても、騒がしい場所でもきちんと音声が認識できるよう様々な現場の騒音環境も調べ、当社の技術を駆使して精度を高めました」(菅原係長)

メガホンヤクの使用イメージ