富士通研究所と富士通研究開発中心は、手書き文字列での画像認識において、信頼性の高い認識結果を出力する人工知能モデルを開発した。文字列中の区切りも効果的に判別でき、文字の認識ミスを従来の半分以下に抑える。
富士通研究所と、中国北京を本拠地とする富士通研究開発中心は2016年11月8日、手書き文字列での画像認識で、信頼性の高い認識結果を出力する人工知能モデルを開発したと発表した。
従来の人工知能モデルによる中国語の文字認識は、手書きの文字列に適用すると、文字の区切りを正しく判別できないことが課題となっていた。
両社は、中国語文中で隣り合って現れやすいパーツの組み合わせを「非文字」(部首やつくり、またそれらを組み合わせても文字にならないもの)とし、その教師サンプルを作成。これを従来の文字の教師サンプルに加えて異種深層学習モデルとした。
また、学習済みの異種深層学習モデルに対し、正しい文字の候補領域には高い信頼度、文字ではない候補領域には低い信頼度を出力する仕組みを設定。文字列中の文字の区切りを効果的に判別する技術を開発した。これにより、正しい文字のみに高い信頼度が出力され、文字の認識ミスを従来の半分以下に抑止できるようになった。
さらに、既存の中国語言語処理モデルを適用して、認識候補が正しい中国語の文字列になるか否かを解析し、候補文章を出力する。
同技術は、単語の区切りにスペースを用いない中国語や日本語、韓国語などの言語に対して有効だ。また、これを富士通研究所の日本語言語処理技術と融合することで、日本語の手書き文字においても認識精度の向上が期待できる。
2017年には、同技術を富士通のAI技術「Zinrai」に活用し、日本向けの手書き帳票電子化などのソリューションに順次適用していく。
Copyright © ITmedia, Inc. All Rights Reserved.