ただし、このままでは認識精度が向上しないため、tesseractの機械学習機能を利用して認識率の向上を図ります。
まず、3.で修正した文字については、変換前の画像と修正したデータを辞書に書き込みます。例えば、「9」を「7」と誤認識した場合には、その文字の画像と正解である9という値を辞書に書き込みます。このような形で、変換ミスをした画像と正しい値を機械学習して学習モデルに覚え込ませます。
この手順で学習した場合にきちんと認識率が向上するのかを評価してみました。調査の手順は以下の通りです。
機械学習ごとの調査結果を図4に示します。
最初の正答率は83%となっています。次に、最初の機械学習を行うと手書き文字を認識しますので、いったん正答率が77%に下がりました。そこから回数を重ねていくと正答率が向上し始めます。10回学習をした結果、正答率は95%まで向上しました。
この調査結果から、数字であれば、手書き文字の変換は機械学習を活用することでかなり高い認識率を実現できることが分かりました。しかしながら、図4のStep4にあるように、逆に読みにくい文字で機械学習を行うと認識率が低下することも確認できました。
紙を使った手書き日報を利用している時代のことですが、外国人の方が判別しにくい文字で記入している場合には、毎日工場長がそれをチェックして、読みやすい文字で書くように指導していました。今回のAI-OCRのようなデジタル化の取り組みを始める際にも、こういった指導は必要になるでしょう。
また、アナログ文化をデジタル文化に段階的に移行する方法の一つとして、いきなり自動化するのではなく、半自動化から始めることなどもご検討いただければと思います。
⇒前回(第4回)はこちら
⇒次回(第6回)はこちら
⇒本連載の目次はこちら
株式会社アムイ 代表取締役
山田 浩貢(やまだ ひろつぐ)
NTTデータ東海にて1990年代前半より製造業における生産管理パッケージシステムの企画開発・ユーザー適用および大手自動車部品メーカーを中心とした生産系業務改革、
原価企画・原価管理システム構築のプロジェクトマネージメントに従事。2013年に株式会社アムイを設立し大手から中堅中小製造業の業務改革、業務改善に伴うIT推進コンサルティングを手掛けている。「現場目線でのものづくり強化と経営効率向上にITを生かす」活動を展開中。
Copyright © ITmedia, Inc. All Rights Reserved.