検索
連載

ラズパイとAI-OCRで生産日報を電子化する(後編)ラズパイで製造業のお手軽IoT活用(5)(2/2 ページ)

小型ボードコンピュータ「Raspberry Pi(ラズパイ)」を使って、低コストかつ現場レベルでIoT(モノのインターネット)を活用する手法について解説する本連載。第5回は、前回に引き続き、AI技術の活用事例として注目を集めるAI-OCRとラズパイの組み合わせによる生産日報の電子化について具体的に解説します。

Share
Tweet
LINE
Hatena
前のページへ |       
※本記事はアフィリエイトプログラムによる収益を得ています

4.修正した箇所を機械学習して認識率を向上させる

 ただし、このままでは認識精度が向上しないため、tesseractの機械学習機能を利用して認識率の向上を図ります。

 まず、3.で修正した文字については、変換前の画像と修正したデータを辞書に書き込みます。例えば、「9」を「7」と誤認識した場合には、その文字の画像と正解である9という値を辞書に書き込みます。このような形で、変換ミスをした画像と正しい値を機械学習して学習モデルに覚え込ませます。

 この手順で学習した場合にきちんと認識率が向上するのかを評価してみました。調査の手順は以下の通りです。

  • 手書き文字に近いフォントの文字をマスター画像としてあらかじめ用意
  • 次に手書き文字の画像を0〜9までの10枚のセットを10グループ用意。計1000枚
  • 毎回1グループ学習させて手書き文字500枚を評価する

 機械学習ごとの調査結果を図4に示します。

図4
図4 機械学習回数別の正答率の推移(クリックで拡大)

 最初の正答率は83%となっています。次に、最初の機械学習を行うと手書き文字を認識しますので、いったん正答率が77%に下がりました。そこから回数を重ねていくと正答率が向上し始めます。10回学習をした結果、正答率は95%まで向上しました。

 この調査結果から、数字であれば、手書き文字の変換は機械学習を活用することでかなり高い認識率を実現できることが分かりました。しかしながら、図4のStep4にあるように、逆に読みにくい文字で機械学習を行うと認識率が低下することも確認できました。

 紙を使った手書き日報を利用している時代のことですが、外国人の方が判別しにくい文字で記入している場合には、毎日工場長がそれをチェックして、読みやすい文字で書くように指導していました。今回のAI-OCRのようなデジタル化の取り組みを始める際にも、こういった指導は必要になるでしょう。

 また、アナログ文化をデジタル文化に段階的に移行する方法の一つとして、いきなり自動化するのではなく、半自動化から始めることなどもご検討いただければと思います。

⇒前回(第4回)はこちら
⇒次回(第6回)はこちら
⇒本連載の目次はこちら

本連載執筆の山田浩貢氏のIoT関連書籍が好評発売中です!

筆者紹介

株式会社アムイ 代表取締役
山田 浩貢(やまだ ひろつぐ)

NTTデータ東海にて1990年代前半より製造業における生産管理パッケージシステムの企画開発・ユーザー適用および大手自動車部品メーカーを中心とした生産系業務改革、

原価企画・原価管理システム構築のプロジェクトマネージメントに従事。2013年に株式会社アムイを設立し大手から中堅中小製造業の業務改革、業務改善に伴うIT推進コンサルティングを手掛けている。「現場目線でのものづくり強化と経営効率向上にITを生かす」活動を展開中。


前のページへ |       

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る