産業技術総合研究所は、AIの学習に必要な画像データセットを数式から自動生成し、学習済みモデルを構築する手法を開発した。画像のプライバシーやラベル付けコストの問題を解消し、従来手法を上回る精度を提供する。
産業技術総合研究所(産総研)は2022年6月13日、AI(人工知能)の学習に必要な画像データセットを数式から自動生成し、学習済みモデルを構築する手法を開発したと発表した。画像のプライバシーやラベル付けコストの問題を解消しつつ、従来手法を上回る精度を提供する。医療分野や交通シーン解析、物流現場などに適する。
今回、産総研では、フラクタル幾何や輪郭形状といった数式から大規模画像データを自動生成することに成功した。この手法では、画像の生成時に教師ラベルも自動生成するため、ラベル付けに伴う人件費を削減できる。また、プライバシー侵害や不公平な認識結果など、画像データ関連の問題も解決できる。
自動生成した大規模画像データセットを使ってAIが視覚特徴を学習することで、画像認識AI向けの学習済みモデルを構築できた。同モデルに画像認識のベンチマークとなる画像データセット「ImageNet」を与えたところ、人が介在する従来手法による実画像データセットを用いた場合よりも、高い画像認識精度を示した。
同研究は、新エネルギー・産業技術総合開発機構(NEDO)の「人と共に進化する次世代人工知能に関する技術開発事業」の一環となる。今後、動画や距離情報を含む画像にも対応するとともに、モーション認識や画像領域推定などの機能を拡張する予定だ。また、今回の知見を生かして「汎用学習済みモデル」の開発も進めるとしている。
AIと機械学習とディープラーニングは何が違うのか
機械学習はどうやって使うのか――意外と地道な積み重ね
AI活用が進む自動車業界、その継続的な運用に必要な「MLOps」とは
複数のAIアクセラレーターを内蔵した試作チップの動作を確認
カーボンナノチューブ膜の物性予測時間を98.8%短縮、深層学習AIの応用で
実効効率で世界トップクラスのエッジAIプロセッサアーキテクチャ、東工大が開発Copyright © ITmedia, Inc. All Rights Reserved.
組み込み開発の記事ランキング
コーナーリンク
よく読まれている編集記者コラム