検索
ニュース

パナソニックHDがAI開発コスト10分の1へ、画像生成AIのパーソナライズをN倍効率化人工知能ニュース(2/2 ページ)

パナソニック R&D カンパニー オブ アメリカとパナソニック ホールディングスは、ユーザーの「Good(いいね)」や「Bad(嫌い)」といったバイナリフィードバックで生成モデルを調整し、ユーザーの目的や好みに合わせた画像を効率よく生成できる画像生成AI「Diffusion-KTO」を開発した。

Share
Tweet
LINE
Hatena
前のページへ |       

従来手法比べて定性評価でも定量評価でも勝ち越し

 Diffusion-KTOは、従来の選好学習を用いる画像生成AIとの比較を、人間による定性評価とAIによる定量評価の両方を行っている。人間による定性評価は、Amazon.comが提供するオンラインクラウドソーシングサービスである「Amazon Mechanical Turk」で募った300人による生成画像の評価で行った。その結果、ベースとなるStable Diffusion v1-5との比較で最も高い勝率を得るとともに、他手法との比較でも50%以上の勝率(勝ち越し)となった。

人間による定性評価に基づく「Diffusion-KTO」と従来の選好学習を用いる画像生成AIとの比較
人間による定性評価に基づく「Diffusion-KTO」と従来の選好学習を用いる画像生成AIとの比較[クリックで拡大] 出所:パナソニックHD

 画像AIを用いた定量評価は、アートに対する人間の審美眼を学習した「Athletic」、画像とテキスト特徴の適合度合を測る「CLIP」、画像と説明文に対する人間の好みを学習した「PickScore」「ImageReward」「HPS v2」という5つの画像AIモデルによる評価を行った。その結果、Stable Diffusion v1-5に対する勝率で最大87.2%を記録するなど、従来の選好学習に対して全ての評価指標で上回ったという。

画像AIを用いた定量評価に基づく「Diffusion-KTO」と従来の選好学習を用いる画像生成AIとの比較
画像AIを用いた定量評価に基づく「Diffusion-KTO」と従来の選好学習を用いる画像生成AIとの比較[クリックで拡大] 出所:パナソニックHD

 今後は、パナソニックグループの事業会社がAI活用を進めている現場において、さまざまな特徴を反映した画像を生成することでAIの学習データ不足を解決する一助としたい考えだ。例えば、冷蔵庫にどのような食品や食材が入っているかの在庫確認が可能な「冷蔵庫AIカメラ」では、珍しい野菜やパック詰めやラップされた野菜は学習データが少ない低頻度画像データになる。そこで、適切な冷蔵庫内の画像を生成する生成AIの学習を行う際には、「いいね」のラベルを付加した画像データ1000枚を用意してDiffusion-KTOによるパーソナライズを行えばよい。2枚の画像データに対する比較情報を1000セット用意するよりも大幅に手間を省けるようになる。

「冷蔵庫AIカメラ」を例にした現場/製品向け学習データ生成への活用のイメージ
「冷蔵庫AIカメラ」を例にした現場/製品向け学習データ生成への活用のイメージ[クリックで拡大] 出所:パナソニックHD

 なお、今回の研究成果は、AI/機械学習技術のトップカンファレンスである「NeurIPS 2024」(024年12月10〜14日、カナダ・バンクーバー)に採択されており、本会議で発表される予定だ。

⇒その他の「人工知能ニュース」の記事はこちら

Copyright © ITmedia, Inc. All Rights Reserved.

前のページへ |       
ページトップに戻る