Alexaの目的は、人々の中にシームレスに溶け込むことである。「環境の中にあるデバイスと自然に会話する」ことが目的であり、これに向けてさまざまな技術開発やパートナーシップなどを実施している。
まず挙げられるのはスキル開発の活発化である。「最も大事なのが、サードパーティーによるスキル開発だ。それによって、Alexaの利用者は自分の好きなスキルを選んで、よりパーソナル化した体験を楽しむことができる」(ジェイン氏)。現在は3万以上のスキルが開発されている。日本のコンシューマー向けにも600以上のスキルを用意している。また、スキルの使いやすさも高まっているという。
利用者にとっての利便性をさらに高めるには、Alexaが利用者の住む地域に関する知識を学習する必要性を挙げている。例えば、日本のユーザーが音楽を聴く時、アーティスト名を指示するが「ドリカムをかけて」と呼びかけた場合、この略した呼び名を、Alexaが把握しておく必要がある。こうしたローカルの知識が幅広い利用者への対応につながる。「これが民主化の一部としてわれわれが行っていることだ」(ジェイン氏)。
Alexaの根底となるテクノロジーにはシンクライアント技術、クラウド技術、機械言語アルゴリズム技術などさまざまのものがある。これらはクラウド側で処理するケースが多いが、アマゾンではより性能を高めるためにさまざまな取り組みを進めている。
このうち機械言語ソリューションの問題の1つに、ラベル化したデータが必要となる点がある。自動音声認識の後に自然言語の認識をしなければならず、言葉の順序も重要である。なるべくあいまいさを取り除いて、理解するためには文脈(コンテキスト)を見て、解釈することになる。この領域では、より精度の高い推論を行うためのイノベーションに取り組んでいるという。
さらに研究者は、音声言語の最先端を行っているだけでなく、学びの共有も行っている。Alexaをよりスマートにするためにローカルの知識を活用する他、サイエンスエンジニアリングチームにより、さらに高める取り組みを進めているという。
この他、2016年から大学向けのコンテストである「The Alexa Prize」を実施し、対話型AI開発を加速させる。これは文化や政治など関する対話していくソーシャルボットを作るもので、最も高い性能を構築できたチームには50万ドルが賞金として贈られる。また、このソーシャルボットにより、自然な対話を20分間続けることができれば、さらに100万ドルが与えられる。「20分間対話を続けられるということは、非常に難しい。ここがAIで最も難しいチャレンジとなる」(ジェイン氏)。2017年はワシントン大学が10分程度対話することができレイティングも比較的高かった。
ソーシャルボットは正確性が高まっており、利用すればするほど学習し、正確度が高まる。サードパーティーとの連携、ローカルナレッジの活用、社内のチームによりAlexaのイノベーションを構築すること、The Alexa Prizeでリサーチやテクニカルコミュニティーとの協力を行うなどの取り組みで、Alexaのスマート化をさらに進めていく考えだ。
Copyright © ITmedia, Inc. All Rights Reserved.