機械学習とディープラーニング、どちらを使えばいいのかAI基礎解説(2/2 ページ)

» 2020年03月12日 10時00分 公開
前のページへ 1|2       

機械学習とディープラーニングの選択に関する検討事項

データに関する検討事項

 使用可能なデータセットを理解すると、機械学習とディープラーニングのどちらを特定のタスクに適用する必要があるかを判断するのに役立ちます。

 一般的に機械学習は、より限定的で構造化されたデータが利用可能な場合に使用されます。ほとんどの機械学習アルゴリズムは、モデルを表形式データ(独立した行と列で構成される)に対して学習するように設計されています。データが表形式でなくても機械学習を適用できますが、データの操作が必要になります。例えば、センサーデータは時系列データなので、一般的な統計量(平均、中央値、標準偏差、歪度、尖度など)を使用してウィンドウ化された特徴量を抽出することで表形式に変換すれば、従来の機械学習手法で使用できます。

 ディープラーニングは、ニューラルネットワークに何千万ものパラメータがあり、学習データに過適合しないニューラルネットワークを確保するために、通常、大量の学習データが必要です。CNNは、画像データに対して動作するように設計されていますが、信号のスペクトログラムなどの時間周波数計算を行うことでセンサーデータにも使用できます。LSTM(長短期記憶)ネットワークなどのRNNは、信号やテキストなどのシーケンシャルデータを操作するように設計されています。

利用可能なハードウェアと展開

 どのAIアプローチを適用すべきかは、使用可能なハードウェアにも依存します。

 機械学習アルゴリズムでは、必要な計算能力が少なくなります。例えば、機械学習モデルの学習であればデスクトップPCのCPUでも十分です。

 ディープラーニングモデルでは、メモリと処理能力への要求が高いため、通常は特化したハードウェアが必要です。CNNなどのディープニューラルネットワーク内で実行される操作は、GPUの並列アーキテクチャに適しているため、特化したハードウェアが適切なのです。GPUが利用可能か、またはCPUで学習させる時間が十分にあるか(かなり時間がかかります)を検討する必要があります。

 GPUの導入に関連するコストが高いため、クラウドやクラスタサーバを用いたディープラーニングモデルの学習が人気を博してきています。このオプションにより、複数の研究者がハードウェアを共有できます。インテルやNVIDIA、Armなどが提供する組み込み機器向けGPUへのディープラーニングモデルの実装も、組み込み機器上で高速な推論速度を提供できるため、人気が高まっています。

進化する科学のためのガイドライン

 試行錯誤は常にありますが、ここまで述べてきたことは、機械学習やディープラーニングを新たに使用するエンジニアや科学者の設計プロセス全体を加速するとともに、意志決定の指針として役立ちます。機械学習とディープラーニングの違いを理解し、プロジェクトの最終的な用途を把握し、データとハードウェアの可用性を考慮することで、設計チームはそれぞれのプロジェクトに最適なアプローチをより迅速に把握することができるでしょう。

筆者プロフィール

photo

阿部 悟(あべ さとる) MathWorks Japan インダストリーマーケティング部 部長

1989年から、本田技術研究所 基礎研究所で超低エミッションエンジン、希薄燃焼エンジンなどの制御システム基礎研究、Formula-1、Indy Carレースの電装システム開発部門で開発をリーディング。2003年からはContinental、AVLなどサプライヤーサイドでエンジン、ボディー、シャシーなどの電装製品の開発に従事。2012年から現職。これまでの経験を生かして業界マーケティング活動を通してモデルベース開発の推進に尽力している。

MathWorks Japan https://jp.mathworks.com/

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.