東芝と統計数理研究所は、欠損を含むデータからでも不具合の要因を特定する機械学習アルゴリズム「HMLasso」を開発した。品質低下や歩留悪化などの要因を高速かつ高精度に特定し、製造現場の生産性の向上に貢献する。
東芝と統計数理研究所は2019年8月2日、欠損を含むデータからでも不具合の要因を特定する機械学習アルゴリズム「HMLasso」を開発したと発表した。本技術の簡易プログラムをオープンソースソフトウェアとして同日より公開している。
HMLassoは、収集した製造データに大量の欠損値が含まれている場合でも、品質低下や歩留悪化などの要因を高速かつ高精度に特定する機械学習アルゴリズムだ。最先端のアルゴリズム「CoCoLasso」比で推定誤差を約41%削減でき、製造現場の信頼性と生産性の向上に貢献することが期待される。
CoCoLassoとは違い、HMLassoは欠損率の高低に応じて柔軟に計算する設計のため、欠損率が高い項目があっても全体の計算精度が低下せず、高精度な回帰モデルの構築が可能だ。
また、欠損値を含むデータから直接回帰モデルを構築できるため、全体の計算時間を短縮する。さらに、データ項目が多い場合でもスパースモデリング技術の応用により、多くのデータ項目から品質や歩留への影響度の高い重要な項目だけを自動で絞り込める。
Copyright © ITmedia, Inc. All Rights Reserved.