日立製作所は、既存の物体検知AIに後付けして精度を最大50%改善する補正技術を開発した。画像全体の予測と検知領域ごとの予測を統合し補正する。
日立製作所は2026年6月5日、画像から対象物を検知する際に用いる既存の物体検知AI(人工知能)の検知結果を、後付けで補正するAI技術を開発したと発表した。画像1枚当たり約0.1秒の処理時間で、従来モデルと比較して最大50%の検知精度改善を確認した。
同技術は、日立グループの中期経営計画で注力している、次世代デジタルソリューション群「Lumada 3.0」の中核技術の1つとして位置付ける考えである。
製造現場においては、製品検査、設備保守、インフラ監視、空撮画像解析などさまざまな分野で、画像や映像から対象物を検知するAIの導入が拡大している。しかし、類似した外観を持つ対象が多数存在したり、複雑な背景や時間経過による環境変化が生じたりする現場では、誤検知や見逃しのリスクが指摘されていた。さらに、その検知結果を補正するには、多くの場合で既存のAIモデルに対して再学習や改修を施す必要があった。
そこで日立製作所は、画像全体の状況と領域の情報を統合して補正する手法を考案した。まず「特徴抽出モジュール」によって、画像全体と領域ごとの特徴を取得する。次に、取得した情報を「特徴統合モジュール」に入力し、全体と領域ごとの関係性を互いに分析する。画像全体が何であるかを判断する全体の予測と、検知領域が何であるかを判断する領域ごとの予測の双方を出力できるようにし、これらを元の物体検知結果と組み合わせることで、より正確な補正を行う仕組みだ。
検知対象の画像と、AIが予測するラベル情報、検知領域の座標情報のみを入力情報として処理するため、AIモデルの内部構造や学習済みパラメータに依存せず、再学習や改修を行うことなく適用可能だ。これにより、コードが公開されている通常の物体検知AI以外の、API経由で利用する生成AIサービスなどにも後付けで適用できる。
公開ベンチマークを用いた性能評価では、物体検出系のオープン基盤モデルである「Grounding DINO」や「LLMDet」に適用した結果、最大50%の検知精度の改善を確認した。同技術を適用した際の追加の処理時間は、画像1枚当たり約0.1秒だ。
日立製作所は今後、各業務環境に応じた適用技術の高度化や他のAI技術との連携を進め、製造、設備保守、インフラ監視などの分野へ展開していく方針である。
日立における「Lumada 3.0」と「HMAX」の定義とは、フィジカルAIが成長を後押し
PCマウス原理でエレベーターの“ロープ”不要に AI保守を見据える日立HMAX戦略
日立とAnthropic、戦略的協業により先進的AIを活用で事業モデルを強化
Astemoと日立が運転支援AI開発基盤構築の狙いを説明、「SDVのさらなる強化へ」
日立のフィジカルAI統合モデル「IWIM」の実力は? 試作ロボット2種を公開
日立がCIセクターの体制を刷新、新たなセクターCEOにCOOの網谷憲晴氏が就任Copyright © ITmedia, Inc. All Rights Reserved.
組み込み開発の記事ランキング
コーナーリンク