今回のCVPR2021では、このHome Action Genomeについて、「対照学習(Contrastive Learning)」を用いることで行動認識性能の向上が図れるという研究成果が採択された。
対照学習とは、機械学習の分類問題で特徴抽出と識別面生成を行う際に、同じものは近く、異なるものは遠くなるように特徴量を学習する手法である。これにより、見え方が違っていても同じものは同じという一貫性を保てるようになり、見え方の違いにあまり影響を受けずに正しい認識が可能になる。
今回の研究成果では、Home Action Genomeを用いて、複数視点、モダリティ、行動・詳細動作の対照学習を行うことで、住空間における複雑な行動の認識性能を向上することができたという。特に、日常行動70種類と453の詳細動作の網羅によって、行動と詳細動作の間の相互作用から一貫性を持った特徴量の学習が可能になったという。
もう1つの採択された研究成果は、対照学習と同じく機械学習のテクニックであるデータ拡張を進化させるAutoDOである。
AIにおける学習で大きな課題になっているのがデータ不足だろう。例えば、車載カメラによる前方認識のAIを開発する場合、歩行者や自転車などの高い頻度で現れる対象のデータは収集しやすいが、子供やベビーカーなど低頻度でしか出現しない対象のデータは収集が難しい。工場などでの求められる外観検査のAIでも、学習に用いる不良品のデータそのものが少ないことが問題になっている。
データ拡張は、これらのように収集が難しいデータを水増しする技術である。画像であれば、回転やズーム、併進、色変換などによって疑似的にデータ数を増やすのだ。
ただし、データ拡張を行うと、データ量の増加による逆効果が発生してしまうことがある。例えば、犬と猫の画像分類の場合に、識別面が理想的な位置からずれてしまい、犬を猫と分類してしまうようなことも起こり得る。このような事態を避けるため、データ拡張を行う際には、データサイエンティストなどの専門家による適切なパラメータのチューニングが必要だった。
AutoDOは、学習データの分布に応じて自動的に最適なデータ拡張のパラメータを調整する技術である。これによって、データ不足が課題になっていた分野へのAI技術の応用を進めやすくなるという。
築澤氏は「AIをはじめとする研究開発において、当社は大学や研究機関など社外と連携したオープンイノベーションに取り組んできた。そういう意味で、Home Action Genomeを公開することによる共創が特別なわけではない。これまでも、これからも、共創を通じて世の中へのお役立ちを実現していきたい」と述べている。
Copyright © ITmedia, Inc. All Rights Reserved.