産業技術総合研究所は、AIを用いて人間に中途半端に似た対象を不快と評価する「不気味の谷」現象を確認した。ロボット工学の課題となっていた不気味の谷現象の克服や人間が親しみを感じるロボットデザインへの応用が期待される。
産業技術総合研究所は2023年5月19日、AI(人工知能)を用いて、人間に中途半端に似た対象を不快と評価する「不気味の谷」現象を確認したと発表した。同研究所 人間情報インタラクション研究部門 主任研究員の林隆介氏らによる研究成果だ。
今回の研究では、新しいAI技術となるCLIPを活用。CLIPは、画像と説明文の間の対応関係を学習し、両者の意味内容の一致度を出力できる。さまざまな画像を標準的な既存の学習済みAIモデルに入力し、人間はどのような画像を、どのような感情表現と結び付けて解釈する傾向があるのかを調べた。
画像については、5つのカテゴリー(人間の顔、サルの顔、車、食べ物、靴)の3D CGを作成し、異なるカテゴリーの間で、一方の画像から徐々にもう片方の画像に変化させるモーフィング加工を施した合計5040枚を用意した。
第1の実験では、CLIPの学習モデルを用いて、SD法に含まれる形容詞群と、モーフィング画像との内容の一致度を解析した。SD法とは、対象となる物や事に抱く感情や印象を「明るい−暗い」「人工的な−自然な」といった対立する形容詞の対からなる質問項目について回答させる心理学の手法だ。
解析後の出力値を「人間らしさ」「不気味さ」「魅力の高さ」の3つの指標で評価したところ、AIによる「人間らしさ」指標の値は、「人間の顔画像」の合成度が高くになるにつれて高くなった。
「不気味さ」指標と「魅力の高さ」指標は、「人間の顔画像」のモーフィング水準が中間(50%)の画像で、それぞれ最大値と最小値となり、不気味の谷現象と同様の傾向を示した。この結果は、AIで不気味の谷現象を再現できることを意味している。
第2の実験では、SD法で用いた形容詞の代わりに、「人間」に関連する名詞群と、不気味の谷の代表的な例である「ゾンビ」に関連する名詞群をそれぞれ30語用意し、AIでモーフィング画像と名詞群の意味の一致度を解析した。その結果、画像のモーフィング水準が中間のときに「ゾンビ」関連の名詞との一致度が最大になり、不気味なキャラクターとAIが判定したことが分かった。
最後の実験では、24種類の感情カテゴリーに含まれる630語の形容詞群を用いた。この実験でも画像のモーフィング水準が中間のときに、「不気味さ」と密接に関連する、「嫌悪」「恐怖」などのネガティブな感情カテゴリーとの一致度が最大となった。
人間とのコミュニケーションに用いられるロボットやCGアバターは、人間が親しみを感じるようなデザインが求められる。そのため、人間に中途半端に似た対象を不快と評価する不気味の谷現象の克服は、ロボット工学やCG工学の課題となっていた。
今回の研究成果は、不気味の谷の研究にAIを活用した世界で初めてのものとなる。今後、人間が親しみを感じるロボットやアバターのデザイン評価手法に活用される可能性を示している。
Copyright © ITmedia, Inc. All Rights Reserved.