東芝のインダストリアルAIは、同社が注力しているインフラサービス向けに適したAIでもある。インフラサービスはミッションクリティカルであるだけでなく、データの欠損が多く、学習に必要な異常データが少ない。大規模で多くの調整パラメータを扱う必要のある複雑なシステムを用いることが多く、人との協調作業も求められる。
会見では、同社 研究開発センター 知能化システム研究所 所長の西浦正英氏が、現在研究開発中の5つのインダストリアルAIと、インフラサービス向けに求められる要素との対応について説明した。
1つ目に紹介した「少量多品種の半導体製造における欠陥要員解析」は、1品種ごとの生産量が少ないことによる異常データの少なさに対応するものだ。例えば、製品1と製品2の半導体ウェーハでチップサイズが異なる場合、それぞれの生産ウェーハの数が少ない(少量生産)と、検査工程で得た検査データに基づく不良分類を十分に行えず、不良が発生した装置の推定が難しくなる。そこで、複数製品のウェーハ上の不良分布を統一して分類できる技術を開発し、異なるチップサイズの製品ウェーハでも不良の分布パターンを比較できるようにした。その成果として、44製品をまたいだ不良マップ分類により精度が75.3%から83.3%に向上したという。
この技術は、東芝デバイス&ストレージグループの半導体工場に適用済みで、不良の要因解析にかかる時間を4.2時間/人・日から0.5時間/人・日に短縮した。また、生産中の半導体製品の80%以上をカバーできている。
2つ目の要因解析技術「HMLasso」は、欠損の多いデータに対応するAI技術だ。製造工程のデータから品質特性に関係する要因を抽出する場合には、品質特性値を要因となる製造工程データとその寄与度の積の和としてモデル化するLasso回帰を用いることが多い。これにより、寄与度の大きい要因=製造工程データが重要であることが分かる。しかし、製品ごとにきちんと製造工程データを収集できるとは限らず、それぞれ歯抜け状態の欠損データになっていることも多い。
そこで、一般的なLasso回帰とは異なり、目的変数と欠損のある説明変数から要因を観測できた割合を利用して寄与度を推定するのがHMLassoである。HMLassoにより、50%程度の欠損を含むデータに対しても要因解析を行えるとしている。
3つ目は「情報モデルを利用したソフトウェアモジュール共通化」で、大規模複雑システム向けのAIを効率良く開発するのに用いられる。個別のデータに対して個別のソフトウェア開発を行うと、そのソフトウェアを他の用途で再利用することが難しくなるが、これは個別データに最適化したソフトウェアの“作り込み”が発生してしまうためだ。そこで、装置の属性や状態値を構造化して定義した「情報モデル」とデータをひも付けて、ソフトウェアの再利用性を高めるのがこの開発技術の狙いになる。
情報モデルの設計を容易化するために、情報モデルを設計するためのエディターと設計内容を修正するバリデーターを開発した。西浦氏は「情報モデルエディターはExcel上で利用可能であり、これと関わる国際標準のIEC 61360/62656の策定にも東芝は携わっている」と強調する。
4つ目のカメラ画像から混雑度を計測する「群集計測技術」は、人との協調作業との関わりが深い。2020年6月に発表したこの技術は、画像の中でさまざまな大きさで映る人の頭部の推定に対応したニューラルネットワーク構造によるコンパクトな処理が特徴。通常はGPUが必要になるところを、CPU1つで処理できる軽量化を実現した。
5つ目のリアルタイム音声字幕システム「ToScLive」も、人との協調作業と関わる技術だ。発話音声の特徴から、「えーと」などに代表される「フィラー」や「言いよどみ」などの不要な語を検出・除去できるとともに、専門用語の文章ファイルからの自動抽出や登録が行える。コロナ禍における大学のオンライン授業に適用したところ反響が大きく、現在は法政大学や慶応大学などで実証実験を進めているところだ。
Copyright © ITmedia, Inc. All Rights Reserved.