教示作業なしで不良品データを高精度に分類する深層学習技術を開発FAニュース

東芝は、事前の教示作業なしで不良品データを高精度に分類できる深層学習「深層クラスタリング技術」を開発した。従来技術に独自の学習基準を導入して、少量の不良品データ群が他の良品データに混入するのを抑制し、分類制度を98.4%に高めた。

» 2018年12月07日 06時00分 公開
[MONOist]

 東芝は2018年11月14日、事前の教示作業なしで不良品データを高精度に分類できる深層学習「深層クラスタリング技術」を発表した。製品の品質確認時に、人手や時間のかかる教示作業(教師あり学習)をしなくても、多量のデータの中から少量の不良品データを高精度に分類できる。

 従来のクラスタリング技術では、データ間の距離や類似度などの基準から、データをクラスタというグループに分類する。少量のクラスタではクラスタ中心からデータまでの距離が短いため、クラスタの外にあるデータもクラスタ中心に近いと判断する。そのため、良品に比べて不良品の数が少ない場合、少量のデータ群(不良品)に他のデータ(良品)が混入するケースが発生していた。

 同社が開発した深層クラスタリング技術は、クラスタの中心にデータ群が集まる従来の学習基準に加えて、独自の学習基準を導入している。これは類似度の高いデータ同士が離れないようにするもので、少量のデータ群が他のデータに混入することを抑制し、少量のデータ群を独立したクラスタとして分類できるようになった。

 同技術を手書き数字の公開データに適用したところ、教師なし学習での分類精度が従来の93.8%から、98.4%に向上した。

 同社は今後、社内外の半導体および他分野の製造現場へ向けて、同技術を広く適用していく。

photo 手書き数字の少量の「0」と多量の「6」を分類する例(クリックで拡大) 出典:東芝

Copyright © ITmedia, Inc. All Rights Reserved.