パナソニックHDがAI開発コスト10分の1へ、画像生成AIのパーソナライズをN倍効率化:人工知能ニュース(2/2 ページ)
パナソニック R&D カンパニー オブ アメリカとパナソニック ホールディングスは、ユーザーの「Good(いいね)」や「Bad(嫌い)」といったバイナリフィードバックで生成モデルを調整し、ユーザーの目的や好みに合わせた画像を効率よく生成できる画像生成AI「Diffusion-KTO」を開発した。
従来手法比べて定性評価でも定量評価でも勝ち越し
Diffusion-KTOは、従来の選好学習を用いる画像生成AIとの比較を、人間による定性評価とAIによる定量評価の両方を行っている。人間による定性評価は、Amazon.comが提供するオンラインクラウドソーシングサービスである「Amazon Mechanical Turk」で募った300人による生成画像の評価で行った。その結果、ベースとなるStable Diffusion v1-5との比較で最も高い勝率を得るとともに、他手法との比較でも50%以上の勝率(勝ち越し)となった。
画像AIを用いた定量評価は、アートに対する人間の審美眼を学習した「Athletic」、画像とテキスト特徴の適合度合を測る「CLIP」、画像と説明文に対する人間の好みを学習した「PickScore」「ImageReward」「HPS v2」という5つの画像AIモデルによる評価を行った。その結果、Stable Diffusion v1-5に対する勝率で最大87.2%を記録するなど、従来の選好学習に対して全ての評価指標で上回ったという。
今後は、パナソニックグループの事業会社がAI活用を進めている現場において、さまざまな特徴を反映した画像を生成することでAIの学習データ不足を解決する一助としたい考えだ。例えば、冷蔵庫にどのような食品や食材が入っているかの在庫確認が可能な「冷蔵庫AIカメラ」では、珍しい野菜やパック詰めやラップされた野菜は学習データが少ない低頻度画像データになる。そこで、適切な冷蔵庫内の画像を生成する生成AIの学習を行う際には、「いいね」のラベルを付加した画像データ1000枚を用意してDiffusion-KTOによるパーソナライズを行えばよい。2枚の画像データに対する比較情報を1000セット用意するよりも大幅に手間を省けるようになる。
なお、今回の研究成果は、AI/機械学習技術のトップカンファレンスである「NeurIPS 2024」(024年12月10〜14日、カナダ・バンクーバー)に採択されており、本会議で発表される予定だ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- AI活用の障壁であるアノテーションの自動化でパナソニックHDとFastLabelが協業
パナソニックHDとFastLabelは、パナソニックグループのAI開発の効率化を目的とし協業を行う。AIプロセス全体の効率化とともに、パナソニックHDが開発するマルチモーダル基盤モデル「HIPIE」とFastLabelのData-Centric AIプラットフォームを統合し、自動アノテーションモデルとして構築する。 - 画像認識AIの現場実装作業が10分の1に、パナソニックHDが汎用基盤モデルを開発
パナソニックHDは、画像認識AIを現場実装する際に必要なアノテーションなどの作業負荷を大幅に削減可能な画像認識向けマルチモーダル基盤モデル「HIPIE」を開発した。 - 松下幸之助を生成AIで再現、「怖いくらい似ている」と親族驚く
パナソニックホールディングスとPHP研究所は松下幸之助氏を再現したAIを開発した。現在も改良を重ねている。 - 車載SoCでトランスフォーマーを推論実行、パナソニックオートが100倍に高速化
パナソニック オートモーティブシステムズは、「EdgeTech+ 2024」において、トランスフォーマーをベースにしたAIモデルを車載SoCで高速に処理する技術を披露した。雨や霧などの悪天候の影響をカメラ画像から除去するAI処理について、同技術の適用前と比べて約100倍の高速化を実現したという。 - 動く対象物を1ms以下で検出するロボット向けセンシング技術を開発
パナソニック コネクトは、動く対象物を1ms以下の高精度で検出し、ロボット作業を中断することなくセンシングする技術を開発した。 - 生成AIを応用し、接触の多いタスクのロボット学習を効率化する技術を開発
パナソニックホールディングスは、ロボット制御向けのAI技術「Diffusion Contact Model」を開発した。生成AIを応用し、接触の多いタスクでロボットを制御するための学習を効率化、高精度化する。