音声翻訳アプリの日英双方向翻訳がニューラル機械翻訳で精度アップ人工知能ニュース

情報通信研究機構は、日英双方向の話し言葉を対象としたニューラルネットワークを用いた機械翻訳の実用技術を開発した。無料の音声翻訳アプリ「VoiceTra」で精度改善を体験できる。

» 2017年07月14日 08時00分 公開
[MONOist]

 情報通信研究機構(NICT)の先進的音声翻訳研究開発推進センターは2017年6月28日、日英双方向の話し言葉を対象としたニューラルネットワーク(深層学習)を用いた機械翻訳(NMT)の実用技術を開発したと発表した。従来の統計翻訳(SMT)技術に比べ、精度が大幅に向上しており、NICTが開発・公開している無料の音声翻訳アプリ「VoiceTra(ボイストラ)」で精度改善を体験できる。

 NICTでは、2013年に対訳コーパスから自動翻訳の構築にニューラルネットワークを利用した機械翻訳の研究を開始、2016年12月より実用化に着手した。実用化には、さまざまな分野で話し言葉の対話で使われる固有名詞や専門用語辞書の追加が不可欠で、その手段として「単語とその訳語およびそのクラス(意味分類)」を利用する手法を実装した。これらにより翻訳精度が大幅に改善し、防災、買物、タクシーなど多くの分野で9割前後の精度を達成している。

多分野で高い翻訳精度を実現 多分野で高い翻訳精度を実現 出典:NICT
ルールベース機械翻訳(RBMT)からSMT/NMTへ ルールベース機械翻訳(RBMT)からSMT/NMTへ 出典:NICT

 今回、音声認識部分に加え、翻訳のニューラルネットワーク化を実現したことで、VoiceTraのニューラルネットワーク化が前進。VoiceTraは現在、翻訳できる言語が31言語で、うち21言語が音声入力可能、16言語が音声出力可能だが、今回、日英双方向の翻訳にAI翻訳技術を投入し、翻訳品質を大幅に向上させた。

 NMTによる翻訳はSMTによる手法に比べ、平均的に精度が高い。しかし、関連語の混同や、ある表現の繰り返し、訳語の抜け落ちといったNMTに特徴的な誤訳のパターンがあり、その解決が今後の課題だという。

 今回の開発は日英翻訳の双方向のみだが、NICTでは今後、グローバルコミュニケーション計画の目標とされる全10言語(日本語、英語、中国語、韓国語、タイ語、インドネシア語、ベトナム語、ミャンマー語、スペイン語、フランス語)をカバーできるよう順次拡大を進めるとともに、民間での製品化も推進する。さらに現在、特許などの書き言葉用翻訳エンジンのニューラルネットワーク化も進めている。

Copyright © ITmedia, Inc. All Rights Reserved.