一方で、GANの生成ネットワークは隠れ層が複数あるディープニューラルネットワークであるため、大量の画像を高速に生成するには高性能なコンピュータを必要とする。三菱電機は生成ネットワークのモデル構造を独自手法で軽量化し、高速な画像生成に必要な演算量とメモリ量を約10分の1に削減することに成功した。
三菱電機が開発した独自手法のポイントは生成画像の品質にあまり寄与しない隠れ層を間引くことだ。同手法では、まず従来通りにGANによって生成ネットワークと識別ネットワークを学習させる。その後、識別ネットワークに生成ネットワークの各隠れ層における重要度を評価するアルゴリズムを導入し、生成ネットワーク内で重要度の低い隠れ層を削除、生成画像の品質に重要な層のみ残して再学習を行う。
この手法はアプリケーションの精度に寄与しないノードを刈り取るPruning(剪定)とは異なり、隠れ層ごと間引きネットワーク構造を変化させることが特徴。これにより間引く前のネットワークから約90%のノードを削減するという。また、隠れ層を間引いた生成ネットワークの画像品質は「主観評価だが(間引く前と)同等」(杉本氏)とし、同手法による画像品質への大きな影響はないとの認識を示した。この理由について、杉本氏は「隠れ層の数は変わるが、再学習によってノードの重みが変わることでカバーしている」と説明する。
同社はGANの生成ネットワークを用いて自動車の走行画像を生成するデモを実施。従来技術と今回提案した技術による生成ネットワークの性能を比較した。生成ネットワークはIntel Core i7-7500U、16GBのメモリを搭載したノートPC上で動作させた。
従来技術では1枚当たり約3〜5秒の処理時間を必要としていたが、同技術では処理時間が約0.3秒とスムーズに走行画像が出力されていた。同技術を用いた生成ネットワークは「解像度などの条件にもよるが、組み込み系CPUでも動作する可能性がある」(杉本氏)。同社担当者はRaspberry Piクラスの性能でも「実装できるかもしれない」と話す。
同社は同技術の用途として学習用データセット準備の他に、カメラ画像を入力とした自動運転や外観検査、監視システムへの応用を見込む。いずれの用途も車両や装置へ搭載するために組み込み機器のサイズや性能が限られており、同技術のニーズは高いとみられる。実用化の時期に関しては「GAN自体が新しい技術。いつまでに、ということはこれから検討したい」(杉本氏)としている。
Copyright © ITmedia, Inc. All Rights Reserved.