東芝は、画像分類AIのアルゴリズムを開発する際に学習データに人手でタグ付けなどを行う必要がない「教師なし画像分類AI」の分類精度を大幅に高める手法「cIDFD」を開発したと発表した。
東芝は2024年5月8日、画像分類AI(人工知能)のアルゴリズムを開発する際に学習データに人手でタグ付け(アノテーション)などを行う必要がない「教師なし画像分類AI」の分類精度を大幅に高める手法「cIDFD(contrastive IDFD)」を開発したと発表した。「背景パターン画像」と「目的画像」という2つのデータセットを組み合わせてAIの学習を行うことで、半導体製造プロセスを模したベンチマーク画像の分類精度を従来比3倍となる83.0%に高めることに成功した。今後は、同社グループの半導体工場の検査工程などに適用して性能実証を行い、さまざまな製造分野で求められる不良や欠陥の画像分類の用途に向けた実用化を進めていく方針である。
現在用いられているAIは、学習データへの人手によるタグ付けを行う教示作業が必要な「教師ありAI」が一般的だ。これに対して、AIが自ら学習データから特徴を学ぶ「教師なしAI」は教示作業が不要であり、AI開発のコスト低減や導入のしやすさにつながることが期待されている。ただし、AIの精度が低いことが課題になっている。
今回発表したcIDFDの適用対象となる教師なし画像分類AIは、入力された画像データの特徴を基に分類を行う画像分類AIを教示作業なしで行うための手法である。特に製造業の検査プロセスでは、検査画像を分類することで不良や欠陥の発生状況を早期に把握して生産性を向上させる用途で高精度な画像分類AIのニーズが高まっている。
この教師なし画像分類AIにおいても、教師なしAI全体の傾向と同様に精度が低いことが課題である。これは、画像データを分類するグループ化に影響を与える重要な特徴の識別が難しいためで、製造業の検査画像の場合は背景画像などの特徴を基に画像データを分類してしまうことが課題になっている。例えば、空の色のように単純な背景の影響は無視できるものの、半導体の回路のように複雑な背景の場合には、背景につられて本来識別したい不良や欠陥の分類精度が低下してしまう。
cIDFDは、教師なし画像分類AIの学習において、背景パターンの画像から不要な特徴の学習を抑制することで、分類対象が含まれる目的画像から不良や欠陥などの重要な特徴のみを識別できるようにする手法である。背景パターン画像を用いる「背景特徴抽出ネットワーク」を新たに導入し、背景の中に不良や欠陥が含まれる目的画像の特徴を学習する「注目特徴抽出ネットワーク」と組み合わせることで、背景パターンの不要な特徴を無視しつつ、目的画像から必要な特徴を効率的に抽出し、不良や欠陥を高精度に識別/分類できる教師なし画像分類AIを開発できるようになる。
Copyright © ITmedia, Inc. All Rights Reserved.