東芝情報システムは、高精度な教師データを短期間で大量に自動作成する「自動アノテーションサービス」の提供を開始した。教師データ作成の中でも特に時間がかかる画像のセマンティックセグメンテーションを自動化する。
東芝情報システムは2023年1月18日、高精度な教師データを短期間で大量に自動作成する「自動アノテーションサービス」の提供を開始したと発表した。
AI(人工知能)開発にかかる時間の大部分が、AIの学習に使う教師データを手作業で作成するのに使われている。自動アノテーションサービスは、教師データ作成の中でも特に時間がかかる画像のセマンティックセグメンテーションを自動化する。
同サービスでは、画像のセグメンテーション手法を複数組み合わせた自動アノテーションプラットフォームを独自に開発。あらかじめ事前学習を済ませ、顧客から少量の教師例を預かって追加学習させることで、顧客の仕様に合わせた教師データを高精度に自動作成できるようになる。
乗用車、トラック、バイク、自転車、車道などの18クラスを認識する自動運転向け教師データを作成するベンチマークにおいて、教師例5000枚の追加学習で精度(mIoU:mean Intersection over Union)84.7%を達成。より精度向上を図る場合、自動アノテーションサービスで作成した教師データを利用することで、手作業の修正量を大きく削減できる。同ベンチマークでは、手作業では8時間で16枚しか作成できない教師データを、24時間で9600枚作成できたと説明している。
同社は今後、画像のセマンティックセグメンテーション以外の教師データにも自動アノテーションサービスを対応させていく方針を示している。
Copyright © ITmedia, Inc. All Rights Reserved.