AIと機械学習とディープラーニングは何が違うのかいまさら聞けない機械学習入門(前編)(1/3 ページ)

技術開発の進展により加速度的に進化しているAI(人工知能)。このAIという言葉とともに語られているのが、機械学習やディープラーニングだ。AIと機械学習、そしてディープラーニングの違いとは何なのか。

» 2018年03月29日 10時00分 公開

1.はじめに

 最近、ニュースや書籍などでAIという言葉を見聞きすることが多い。人手不足の救世主のように扱われたり、人の仕事を奪う悪魔のように書かれるが、その実体はいまひとつ分かりにくい。ましてや、自分の携わっている仕事に対して、具体的に何をしてくれるのかが分からないという声をよく聞く。

 もう1つややこしいのは、その呼び名である。AI、機械学習、ディープラーニング、それぞれが何のことなのか、どんな関係なのか不明なまま、なんとなく人に聞けなくて腑に落ちない。この記事では機械学習を中心に、その実体を説明したい。

2.AIとは

 AIとはArtificial Intelligenceの略、日本語にすれば人工知能、古くて新しい言葉だ。人間のように賢い知能をコンピュータで構築できたらという夢は、過去にも何度かブームになっては消えていった。

 実はAIそのものに、正式な定義があるわけではない。ちょっと気の利いたアプリケーションやサービスを使うときには、AIのお世話になっているのだ。皆さんが文章の入力に使っている日本語入力も、前後の言葉や使用頻度を勘案して文字を変換しているAIのアプリケーションの1つである。一昔前は、AI変換と呼ばれることもあったくらいだ。また将棋、チェスや囲碁などのコンピュータゲームで対戦相手をしてくれるアプリケーションもAIの一種だろう。

 このようにAIとは、人間のように「知的に見える」アプリケーションの呼び名でしかない。その中のロジックがどうなっているかは問われていない。単に膨大なデータベースから取り出しているだけかもしれないし、後に説明する機械学習を使っているのかもしれない。

3.なぜ今、AIが盛り上がってきているのか

 古くからAIを実現するための研究は進められていたが、最近になって盛り上がりを見せているのは、次の4つの理由がある。

 1つ目は、コンピュータの処理能力および記録容量の飛躍的な増大と、その利用コストの劇的な低下である。2つ目は、Webサービスやスマートフォンの普及により、AIの学習や利用に必要となるデジタル化されたデータ量が激増したことだ。3つ目は、マーケティング、広告や通信販売などでビジネスに大きなインパクトを与えたことになる。商品のレコメンド、適切な広告のマッチング、そして顧客の行動のカテゴライズというように、最近のWebサービスやスマートフォンを対象としたサービスでは不可欠といっても良い重要な機能をAIが担うようになっている。そして4つ目は、ビジネス界からの実運用のフィードバックと金銭的なバックアップにより、優秀な研究者やエンジニアがAIに取り組んでアルゴリズムを改良したり、優れたソフトウェアが次々と開発されていることだ。これらの好循環により、AIは過去に例を見ないほど盛況を博しているのだ。

 AIの盛り上がりは産業界にも波及してきている。これまでAIの利用用途の中心は、スマートフォンを中心としたコンシューマー向けITサービスだった。グーグル(Google)、アマゾン(Amazon)やFacebookといった多くの利用者を抱えるサービスは、大量に集められた個人の行動や情報といったデジタルデータを分析することで、マーケティングや広告に活用することで支えられている。

 しかし、ITの恩恵をそれほど受けてこなかった産業界、とりわけ製造業やサービス業にもAIの波が押し寄せようとしている。IoT(モノのインターネット)によりデジタル化されたデータを集められるようになったからだ。特に日本では、急速な人手不足と熟練作業者の高齢化が重なるため、データ活用による省力化に向けた取り組みは待ったなしの状況にある。タイミング良く、一般エンジニア向けのツールが登場してきておりハードルも徐々に下がってきたことも後押ししている。

4.機械学習で分かるのは「相関」であって「因果」ではない

 機械学習というのは、大規模のデータを統計的なアルゴリズムを使い予測に役立てる技術のことだ。最近のAIで使われる中で最もポピュラーな技術である。大量のデータに対して、統計的な分析やシミュレーションを組み合わせることで、対象となる物事をコンピュータが自動的に分析/予測できるようになる。

 ただし、「統計的な分析」なので、事物を理解するわけではない。あくまで、データで表現されている数値の推移の予測や文字列または画像の分類を行う。これも正式な定義は無いが、対象の理解に重きを置いているのが統計分析で、将来の予測を重視しているのが機械学習である。

 重要なポイントとなるのは、機械学習で判明するのは「相関」であり「因果」ではないということだ。相関ということは、複数の変数に関わりがあることは示せるが、本当に関係しているかどうかは不明なのだ。意味を見いだして「因果」を証明するのは、人間の仕事ということだ。幸いなことに人間の仕事は無くならず、より重要になるのだ。ここに面白い例があるので見てほしい。

図1 図1 機械学習における相関と因果の事例(クリックで拡大) 出典:Spurious Correlations

 図1にある通り、米国メイン州の離婚率と1人当たりのマーガリン消費量の間には、相関があることが分かる。しかしマーガリンの消費量を減らすことと離婚率を減らすことに因果はあるだろうか。ちょっと考えてみれば分かる話なので冗談になるが、製造業の技術者の本業で考えるとこの判別が難しい場合もある。ひとまず、機械学習では相関を扱っている、ということだけは頭の片隅に置いておいた方が良いだろう。

 機械学習に対して否定的に聞こえたかもしれないが、相関しか分からなくてももちろん意味は大きい。機械学習に出番が回ってくるのは、関係する要素が多すぎて因果がそもそも分かっていないからだ。また数値にすることで比較検討ができたり、膨大なデータの分析の見当を付けられたりするだけでも意味はある。また、因果が分かるまではとても時間がかかる。ビジネスではそこまで時間をかけられないという現実があるので、正解ではなくても少しでも良い解なら十分に使えることも多いのだ。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.