検索
特集

住空間データのImageNetとなるか、パナソニックがAIデータセットを公開する狙い研究開発の最前線(2/2 ページ)

パナソニックは「CVPR2021」において2件のAI技術が採択されたと発表。このうち1件と関わる住空間向けデータセット「Home Action Genome」は、同社が独自に構築したもので、住空間向けでは従来にない大規模なデータセットであるにもかかわらず無償で公開されている。その狙いについて、パナソニック テクノロジー本部の担当者に聞いた。

Share
Tweet
LINE
Hatena
前のページへ |       

Home Action Genomeへの「対照学習」の適用と「データ拡張」の自動化

 今回のCVPR2021では、このHome Action Genomeについて、「対照学習(Contrastive Learning)」を用いることで行動認識性能の向上が図れるという研究成果が採択された。

 対照学習とは、機械学習の分類問題で特徴抽出と識別面生成を行う際に、同じものは近く、異なるものは遠くなるように特徴量を学習する手法である。これにより、見え方が違っていても同じものは同じという一貫性を保てるようになり、見え方の違いにあまり影響を受けずに正しい認識が可能になる。

AIの分類問題対象学習のイメージ AIの分類問題(左)と対象学習のイメージ(右)(クリックで拡大) 出典:パナソニック

 今回の研究成果では、Home Action Genomeを用いて、複数視点、モダリティ、行動・詳細動作の対照学習を行うことで、住空間における複雑な行動の認識性能を向上することができたという。特に、日常行動70種類と453の詳細動作の網羅によって、行動と詳細動作の間の相互作用から一貫性を持った特徴量の学習が可能になったという。

「Home Action Genome」に対照学習を適用した
「Home Action Genome」に対照学習を適用した(クリックで拡大) 出典:パナソニック

 もう1つの採択された研究成果は、対照学習と同じく機械学習のテクニックであるデータ拡張を進化させるAutoDOである。

 AIにおける学習で大きな課題になっているのがデータ不足だろう。例えば、車載カメラによる前方認識のAIを開発する場合、歩行者や自転車などの高い頻度で現れる対象のデータは収集しやすいが、子供やベビーカーなど低頻度でしか出現しない対象のデータは収集が難しい。工場などでの求められる外観検査のAIでも、学習に用いる不良品のデータそのものが少ないことが問題になっている。

AIの研究開発ではデータ不足が大きな課題になっている
AIの研究開発ではデータ不足が大きな課題になっている(クリックで拡大) 出典:パナソニック

 データ拡張は、これらのように収集が難しいデータを水増しする技術である。画像であれば、回転やズーム、併進、色変換などによって疑似的にデータ数を増やすのだ。

データ拡張のイメージ
データ拡張のイメージ(クリックで拡大) 出典:パナソニック

 ただし、データ拡張を行うと、データ量の増加による逆効果が発生してしまうことがある。例えば、犬と猫の画像分類の場合に、識別面が理想的な位置からずれてしまい、犬を猫と分類してしまうようなことも起こり得る。このような事態を避けるため、データ拡張を行う際には、データサイエンティストなどの専門家による適切なパラメータのチューニングが必要だった。

 AutoDOは、学習データの分布に応じて自動的に最適なデータ拡張のパラメータを調整する技術である。これによって、データ不足が課題になっていた分野へのAI技術の応用を進めやすくなるという。

データ拡張の課題AutoDOは自動的に最適なデータ拡張のパラメータを調整すデータ拡張の課題(左)。AutoDOは自動的に最適なデータ拡張のパラメータを調整する(右)(クリックで拡大) 出典:パナソニック

 築澤氏は「AIをはじめとする研究開発において、当社は大学や研究機関など社外と連携したオープンイノベーションに取り組んできた。そういう意味で、Home Action Genomeを公開することによる共創が特別なわけではない。これまでも、これからも、共創を通じて世の中へのお役立ちを実現していきたい」と述べている。

⇒その他の「研究開発の最前線」の記事はこちら

Copyright © ITmedia, Inc. All Rights Reserved.

前のページへ |       
ページトップに戻る