富士通研究所は、映像データをAIが認識できる必要最小限のサイズまで高圧縮する技術を開発した。人間による視認を目的とした従来の圧縮技術と比較して、映像データを10分の1以上圧縮できる。
富士通研究所は2020年3月5日、映像データをAI(人工知能)が認識できる必要最小限のサイズまで高圧縮する技術を開発したと発表した。人間による視認を目的とした従来の圧縮技術と比較して、映像データを10分の1以上圧縮できる。
今回開発された技術は、圧縮による画質劣化が認識精度に与える影響を画像の領域ごとに解析し、AIの認識結果も確認して認識精度に影響しない圧縮率を自動で推定する。画像全体の圧縮率を変えて画質を変化させ、格子状に区切った画像領域ごとに認識結果への影響度を集計し、AIによる認識における特徴の重要度合いを領域ごとに判定する。そして、認識精度が急激に劣化する直前の圧縮率を認識精度に影響しない圧縮率として推定する。
さらに、連続する画像でのAIの認識結果をフィードバックし、必要最小限まで圧縮率を高める。これらの技術により、AIが認識できる必要最小限のサイズまで高圧縮を行う。工場で梱包作業を行う複数の作業員の様子を4Kの高精細カメラで撮影した映像に同技術を適用し、認識精度を落とさずにデータサイズを10分の1に削減できることが確認された。
富士通研究所では、同技術の評価およびさらなる研究開発を進めることで、2020年度中の実用化とさまざまな業種への展開を目指す。
Copyright © ITmedia, Inc. All Rights Reserved.