実はAIそのものに、正式な定義があるわけではない。ちょっと気の利いたアプリケーションやサービスを使うときには、AIのお世話になっているのだ。皆さんが文章の入力に使っている日本語入力も、前後の言葉や使用頻度を勘案して文字を変換しているAIのアプリケーションの1つである。一昔前は、AI変換と呼ばれることもあったくらいだ。また将棋、チェスや囲碁などのコンピュータゲームで対戦相手をしてくれるアプリケーションもAIの一種だろう。

　このようにAIとは、人間のように「知的に見える」アプリケーションの呼び名でしかない。その中のロジックがどうなっているかは問われていない。単に膨大なデータベースから取り出しているだけかもしれないし、後に説明する機械学習を使っているのかもしれない。

3．なぜ今、AIが盛り上がってきているのか

　古くからAIを実現するための研究は進められていたが、最近になって盛り上がりを見せているのは、次の4つの理由がある。

　1つ目は、コンピュータの処理能力および記録容量の飛躍的な増大と、その利用コストの劇的な低下である。2つ目は、Webサービスやスマートフォンの普及により、AIの学習や利用に必要となるデジタル化されたデータ量が激増したことだ。3つ目は、マーケティング、広告や通信販売などでビジネスに大きなインパクトを与えたことになる。商品のレコメンド、適切な広告のマッチング、そして顧客の行動のカテゴライズというように、最近のWebサービスやスマートフォンを対象としたサービスでは不可欠といっても良い重要な機能をAIが担うようになっている。そして4つ目は、ビジネス界からの実運用のフィードバックと金銭的なバックアップにより、優秀な研究者やエンジニアがAIに取り組んでアルゴリズムを改良したり、優れたソフトウェアが次々と開発されていることだ。これらの好循環により、AIは過去に例を見ないほど盛況を博しているのだ。

　AIの盛り上がりは産業界にも波及してきている。これまでAIの利用用途の中心は、スマートフォンを中心としたコンシューマー向けITサービスだった。グーグル（Google）、アマゾン（Amazon）やFacebookといった多くの利用者を抱えるサービスは、大量に集められた個人の行動や情報といったデジタルデータを分析することで、マーケティングや広告に活用することで支えられている。

　しかし、ITの恩恵をそれほど受けてこなかった産業界、とりわけ製造業やサービス業にもAIの波が押し寄せようとしている。IoT（モノのインターネット）によりデジタル化されたデータを集められるようになったからだ。特に日本では、急速な人手不足と熟練作業者の高齢化が重なるため、データ活用による省力化に向けた取り組みは待ったなしの状況にある。タイミング良く、一般エンジニア向けのツールが登場してきておりハードルも徐々に下がってきたことも後押ししている。

4．機械学習で分かるのは「相関」であって「因果」ではない

　機械学習というのは、大規模のデータを統計的なアルゴリズムを使い予測に役立てる技術のことだ。最近のAIで使われる中で最もポピュラーな技術である。大量のデータに対して、統計的な分析やシミュレーションを組み合わせることで、対象となる物事をコンピュータが自動的に分析／予測できるようになる。

　ただし、「統計的な分析」なので、事物を理解するわけではない。あくまで、データで表現されている数値の推移の予測や文字列または画像の分類を行う。これも正式な定義は無いが、対象の理解に重きを置いているのが統計分析で、将来の予測を重視しているのが機械学習である。

　重要なポイントとなるのは、機械学習で判明するのは「相関」であり「因果」ではないということだ。相関ということは、複数の変数に関わりがあることは示せるが、本当に関係しているかどうかは不明なのだ。意味を見いだして「因果」を証明するのは、人間の仕事ということだ。幸いなことに人間の仕事は無くならず、より重要になるのだ。ここに面白い例があるので見てほしい。

図1　機械学習における相関と因果の事例（クリックで拡大）出典：Spurious Correlations

　図1にある通り、米国メイン州の離婚率と1人当たりのマーガリン消費量の間には、相関があることが分かる。しかしマーガリンの消費量を減らすことと離婚率を減らすことに因果はあるだろうか。ちょっと考えてみれば分かる話なので冗談になるが、製造業の技術者の本業で考えるとこの判別が難しい場合もある。ひとまず、機械学習では相関を扱っている、ということだけは頭の片隅に置いておいた方が良いだろう。

　機械学習に対して否定的に聞こえたかもしれないが、相関しか分からなくてももちろん意味は大きい。機械学習に出番が回ってくるのは、関係する要素が多すぎて因果がそもそも分かっていないからだ。また数値にすることで比較検討ができたり、膨大なデータの分析の見当を付けられたりするだけでも意味はある。また、因果が分かるまではとても時間がかかる。ビジネスではそこまで時間をかけられないという現実があるので、正解ではなくても少しでも良い解なら十分に使えることも多いのだ。