画像認識AIの現場実装作業が10分の1に、パナソニックHDが汎用基盤モデルを開発:人工知能ニュース(2/2 ページ)
パナソニックHDは、画像認識AIを現場実装する際に必要なアノテーションなどの作業負荷を大幅に削減可能な画像認識向けマルチモーダル基盤モデル「HIPIE」を開発した。
構造上の特徴はマルチモーダルでマルチタスク
従来型の画像認識AIモデルは、入力画像を特徴量に変換するエンコーダーと特徴量を認識結果に変換するデコーダーの組み合わせになっている。また、認識対象は学習データを決めた時点で固定されており、推論の段階ではAIモデルが学習していない物体は学習データの種類で無理やり答えてしまう。
これに対してHIPIEは、LLMの一つであるBERTベースの言語AIとトランスフォーマーモデルで構築した画像AIという2つのエンコーダーを持つとともに、物体検出やセグメンテーションなどの複数の認識タスクに対応したデコーダーも有している。つまり、言語AIと画像AIによるマルチモーダル、複数デコーダーによるマルチタスクが構造上の特徴になっている。
HIPIEでは、BERTに基づく言語AIの特徴量と画像AIの特徴量を近づける学習を行っており、言語AIと画像AIの特徴量が対応するような仕組みになっている。未知の対象を認識する場合には、認識対象に関するテキストプロンプト入力から得られた言語AIの特徴量を参照して画像AIの特徴量とマッチングさせることで、未知の画像であっても再学習せずに認識できるようになっているという。
複数タスクへの対応でも8種類のタスクで高い認識性能を確認しており、これまでの最高性能(SOTA:State-of-the-Art)を上回る結果が得られている。
UCバークレーとの連携による研究成果
今回のHIPIEの研究開発は、2021年度からパナソニック本体の研究開発部門で進めてきた、海外トップ大学や海外研究拠点との「バーチャルラボ体制」に基づくもので、UCバークレー傘下で世界トップクラスのAI研究機関であるBAIR(Berkley AI Research)と連携している。パナソニックHD テクノロジー本部 デジタル・AI技術センター AIソリューション部 1課 課長の小塚和紀氏は「バーチャルラボ体制から公表する開発成果としては2件目になる。この体制では、新たな研究成果も早々に陳腐化してしまうAI技術を早期に実用化するために、事業会社も加わっていることが特徴になっている」と強調する。
なお、HIPIEの開発成果は、AI/機械学習技術の国際カンファレンスである「37th Conference on Neural Information Processing Systems (NeurIPS 2023)」(2023年12月10〜16日、米国ニューオリンズ)に採択された。論文の著者は、UCバークレーの3人と、パナソニックHDの米国研究開発拠点であるPanasonic R&D Company of America(PRDCA)の1人、そして小塚氏と加藤氏の連名となっている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 生産性向上だけじゃない、パナソニックコネクトがChatGPTを全社導入した理由
世界中で話題の「ChatGPT」。国内企業で早期に全社導入を決定した1社がパナソニック コネクトだ。ChatGPT導入に至った背景や活用の可能性について聞いた。 - パナソニックが開発をリードする有機CMOSイメージセンサーは何がすごいのか
裏面照射型に次ぐCMOSイメージセンサーのブレークスルーとして期待されている有機CMOSイメージセンサー。業界内で開発をリードし、実用化に積極的に取り組むパナソニックHDの開発担当者に話を聞いた。 - 見える、見えるぞハイパースペクトルが! パナソニックが世界最高感度技術を開発
パナソニックHDは、人間が知覚できない連続的な色変化(スペクトル情報)を持つハイパースペクトル画像を世界最高感度で撮影する技術を開発した。 - パナソニックがAI倫理原則を発表、実践を後押しするチェックシステムも開発
パナソニック ホールディングスが「パナソニックグループのAI倫理原則」とその実施体制などについて説明。AIの開発、運用、利活用において順守すべき倫理原則として、経営理念に基づく前文と5項目の原則から構成されており、「AI倫理チェックシステム」や全社員を対象とする教育プログラム「AI倫理基礎」などを活用して推進する。 - 顔認証トップのパナソニックが動作予測AIコンテストに挑む、Facebookに肉薄
顔認証トップのパナソニックが、新たなAI技術分野に展開を図るべく、台所での動作認識や予測の精度を競うコンテスト「EPIC-KITCHENS-100」に参加。動作予測部門の23チームの中で、第1位のFAIR(Facebook AI Research)に次ぐ第2位の成績を収めた。 - 住空間データのImageNetとなるか、パナソニックがAIデータセットを公開する狙い
パナソニックは「CVPR2021」において2件のAI技術が採択されたと発表。このうち1件と関わる住空間向けデータセット「Home Action Genome」は、同社が独自に構築したもので、住空間向けでは従来にない大規模なデータセットであるにもかかわらず無償で公開されている。その狙いについて、パナソニック テクノロジー本部の担当者に聞いた。