ニューラル・ネットワークと力の指輪SYSTEM DESIGN JOURNAL(4/5 ページ)

» 2016年07月06日 09時00分 公開
[Ron Wilson(Editor-in-chief,Altera),MONOist]

その他の道

 アクセラレータは、CNNのトレーニングと実行を高速化し、想像を絶するほどの大規模化を可能にします。しかし、アクセラレータは、それだけではネットワークの制限に関する大きな問題に対処できません。

 スタンフォード大学 コンピュータサイエンス学部准教授のSilvio Savarese氏は、「物体に付加された一連のラベルの総和は意味ではない」と釘を刺しました。また、データセットに意味を与え、結論に達することができるコグニティブシステムをアプリケーションが必要とし始めており、CNNはシステム全体の一要素にすぎない、あるいは要素にすらならないという懸念があります。

 自然言語処理の分野では異なる一連のアプローチが浮上しています。例えば、DOCOMO Innovationsのシニア・リサーチ・エンジニア Sayandev Mukherjee氏は、音声またはテキストの非構造化ストリーム(例えば、ソーシャルメディアストリーム)を取り込み、固有名詞、普通名詞、属性、感情などの構成タグ付きオブジェクトに分解するシステムについて説明しました。

 このツールはデータを基礎にして、グラフのノードが概念となるナレッジグラフを作成します。この環境ではグラフ解析ツールが推論ツールとなり、関係や類推を発見したり、帰納や演繹を実行したりすることが可能です。CNNに役割があるとすれば、フロントエンドの音声またはテキスト認識ブロックでしょう。

 この種の手法は、ナレッジグラフと同様、空間的に機能します。Savarese氏は、3次元空間内で物体を検出し、追跡する一見ルールベースのシステムについて説明しました。物体の属性に位置と方向を含めることにより、システムは、2次元画像からは明らかでない物体間の関係を推論できるとSavarese氏は言います。

 Savarese氏は、視野に入る人々の間の関係を推論することにより、大勢の人が行き交うスタンフォード大学のキャンパス内を移動する搬送ロボット「Jackrabbit」の例を挙げました。こうした推論により、ボットが中間試験のことで深い同情を寄せ合う学生グループの中を突っ切ったり、デート中の2人の学生の間に割り込んだりするといった「不作法」を回避することが可能になります。

Copyright © ITmedia, Inc. All Rights Reserved.