インテル IoT テクニカルセールス チーム コンピュータービジョン スペシャリストの志村泰規氏は、インテルのプロセッサ製品群を用いて画像認識技術を引き出すためのツールについて紹介した。
志村氏が主張したのは、インテルのプロセッサ製品のCPUや内蔵GPU、FPGA、アクセラレータが十分な画像認識の処理能力を有しており、これらのソフトウェア開発をブロムフィールド氏が言及したOpenVINOツールキットで行えることだ。
まずCPUについては、統合開発環境で提供されている最適化コンパイラや、IPP(Integrated Performance Primitive)、MKL(Math Kernel Library)、MKL-DNN(MKL-Deep Neural Network)といったライブラリを用いたソフトウェアの最適化により、高い性能を発揮できるという。実際に、オープンソースのフレームワークである「Caffe」で作成したアルゴリズムを「Xeon E5」で実行する場合、最適化前の性能を1とすると、従来のMKLの適用で7.5倍、最新版のMKLの適用でさらに2.2倍で、16.5倍に画像認識性能が向上するという。
また志村氏は、あまり活用されていない内蔵GPUによる性能向上について紹介した。内蔵GPUはCPUと同一の広帯域/低遅延バスに接続されており、Skylake世代プロセッサの内蔵GPU「G4e」であれば72個のEU(実行ユニット)により、「ちょっとした外付けのアクセラレータ並み」(志村氏)とする1.152TFLOPSの演算性能が得られる。
モビディウスのVPU(Vison Processing Unit)「Myriad 2」は、2〜3Wという低消費電力を特徴としているが、2018年末に投入予定の次世代VPU「Myriad X」は性能が約10倍に向上する見込みで「内蔵GPU並みの性能になる」(志村氏)。また、FPGAは演算器のビット幅を自由に構成できることや、深層学習で得たアルゴリズムを書き換えられることがメリットになる。なお、Myriad XやFPGAの顧客への提供形態はPCI Expressカードの「HDDL(High Density Deep Learning)」となる予定で、Myriad Xを搭載するのが「HDDL-R」、FPGAを搭載するのが「HDDL-F」としている。
これらのプロセッサ製品に共通して利用できる画像認識ソフトウェア開発のツールキットがOpenVINOツールキットだ。画像認識アルゴリズムの開発言語として広く利用されている「OpenCV」と、効率的な処理が可能だが使いこなすのに専門知識を必要とする「OpenVX」に加えて、インテル製プロセッサ製品上で効率的に動作する「Inference Engine」などのライブラリをそろえる。またツールとして、さまざまなフレームワークで構築したモデルをInference Engineで動作させられるようにする「Model Optimizer」がある。
OpenVINOツールキットで最も重要なのがInference Engineだ。志村氏は「Inference Engineを使えば、同じ画像認識ソフトウェアでインテルのCPU、内蔵GPU、FPGA、モビディウスのVPUが使える。例えば、CPUで処理能力が物足りないときに内蔵GPUによる処理を追加する場合にも、画像認識ソフトウェアに手を加える必要はない」と説明する。
また、OpenCVでそのまま実行するよりも、Inference Engineを介することでさらに処理性能を向上できる。ある物体認識アルゴリズムの処理能力が、OpenCVだと1回当たり19msだが、Inference Engineを使うと同4msに向上する。
なおOpenVINOツールキットは、商用利用を含めて無償である。志村氏は「インテル製品であれば動作するのでどんどん使ってほしい」(志村氏)という。
Copyright © ITmedia, Inc. All Rights Reserved.