「機械学習を全てのデバイスに」、Armが進めるプロセッサの性能向上組み込み開発ニュース

Armは2019年4月4日、東京都内で記者説明会を開き、クライアントコンピューティング向けに展開する推論エンジンのプラットフォーム「Arm NN」や、CPU、GPUや機械学習用プロセッサ「NPU」の動向について紹介した。

» 2019年04月10日 14時00分 公開
[齊藤由希MONOist]
Armのイアン・スマイス氏(クリックして拡大)

 Armは2019年4月4日、東京都内で記者説明会を開き、クライアントコンピューティング向けに展開する推論エンジンのプラットフォーム「Arm NN」や、CPU、GPUや機械学習用プロセッサ「NPU」の動向について紹介した。

 記者説明会に登壇したArm マーケティングプログラム担当シニアディレクターのイアン・スマイス(Ian Smythe)氏は、さまざまな製品の機械学習がArmのプロセッサコア上で実行されていることを紹介した。スマイス氏は「Armは機械学習を全てのデバイスに向けて提供する。そのためには多様性とスケーラビリティが必要で、効率性も十分に担保されなければならない。Armはソフトウェアとハードウェアを包含したプラットフォーム型で取り組んでいる」と述べた。

さまざまな製品に搭載された機械学習をカバーする(クリックして拡大) 出典:Arm

 要求される処理速度と能力のバランスに合わせてCPU「Cortex-M/A」シリーズやGPU「Mali」、NPUを展開し、ホームアシスタントの音声認識やパターン認識など高いパフォーマンスが要求されない分野から、自動運転車、データセンターまでカバーしている。この展開の中心にあるのが、オープンソースのソフトウェアフレームワーク「Arm NN」だ。CPUやGPU、NPU、パートナー企業のFPGAといった一連のハードウェアを抽象化し、ニューラルネットワークのフレームワークと、AI(人工知能)をつかったアプリケーションを動作させる。一貫性のある開発アプローチを、ソフトウェアフレームワークを通じて、Armのハードウェアに展開できるようにするものだ。

  Arm NNは現在、Linaroの下で管理されている。GoogleとAndroidのニューラルネットワークのチーム、GitHub、Amazonなどと協力しており、2億台以上のデバイスで採用実績がある。スマイス氏は「Arm NNは34万行のソースコードで構成されており、コミュニティにリリースする前は(工数にして)100人年の努力で提供していた。Armとして非常に真剣にエンジニアリングに取り組んだ成果だ」と語る。オープンソース化によって性能向上と最適化が強化されたという。ハードウェアとフレームワークによるが、2〜4倍の性能向上が見られるとしている。

Arm NNは一連のハードウェアに対応する(左)。オープンソース化によって性能向上が強化されたという(右)(クリックして拡大) 出典:Arm

 スマイス氏は「エッジにおける機械学習には興味深い課題がある。どのようにして1兆台のデバイスに機械学習を搭載するかということだ」と述べ、Arm「Cortex-M」向けの拡張機能である「Helium」についても触れた。「小さなデバイスでもベクトル処理の能力を実現する。Heliumを搭載することにより、信号処理性能は5倍以上、特徴点の抽出や意思決定のアルゴリズムのパフォーマンスは15倍以上に向上するという。スマイス氏は「特に重視しているのは、効果的な畳み込みとデータの移動を最小限にすることだ。メモリアクセスを抑え、メモリを駆使することが綿密に設計されている」と紹介した。Heliumは2020年以降、エッジデバイスに搭載されるとしている。

 こうしたArmの取り組みを融合することで、さまざまなソフトウェアがどのハードウェアにも対応することができるようになるという。「パフォーマンスやパワー、エリア、製品化計画に合わせた選択肢を用意している。ツールチェーンを提供することで、一連のシリーズを対象に性能を評価してもらえる。AIがエッジに来た時にわれわれが有利な立場になる理由の1つがこれだ」(スマイス氏)。

 2018年、ArmはCortex CPUを230億台のデバイス向けに出荷した。現在出荷中なのは10nm、7nmプロセスの「Cortex-A76」であり、2019年には7nmプロセスの「Deimos」、2020年には7nm、5nmプロセスの「Hercules」を投入するロードマップである。スマイス氏はCortex-A76がインテルの「Core i5-7300U」のパフォーマンスと並び、Herculesは「Cortex-A73」の2.5倍のパフォーマンスを発揮すると説明した。「今後、効率と性能のトレードオフは無くなっていく。マイクロアーキテクチャへの投資は継続し、性能向上を推し進める」(スマイス氏)。

CPUコアの性能向上のロードマップ(クリックして拡大) 出典:Arm

Copyright © ITmedia, Inc. All Rights Reserved.