日本電信電話は、ハイスピードカメラやレーザー光、AI処理を用いた音の見える化技術を開発した。音の物理特性を考慮した独自の深層学習モデルにより、高精細な音の見える化を可能にした。
日本電信電話(NTT)は2024年6月17日、ハイスピードカメラやレーザー光、AI(人工知能)処理を用いて音を見える化する「光学的音場イメージング技術」を開発したと発表した。音の物理特性を考慮した独自の深層学習モデルにより、光学的音場イメージング技術による高精細な音の見える化も可能になった。
音がある空気中を光が通過する際、気体の粗密に応じて光の速さがわずかに変化する。開発した光学的音場イメージング技術は、レーザー光を音場内に伝搬させ、干渉計を用いて光の微弱な変化を検出し、その変化をハイスピードカメラで捉える。毎秒数千〜数十万フレームの速さで撮影することで、音波を動画像で捉えられる。これにより、音波が空気中をどのように伝わるかを高感度で観測可能にした。
光学的音場イメージング技術を高精細化するために、動画像の中から不要なノイズを除去する独自の深層学習モデルを考案した。このモデルは音の物理特性を考慮したもので、従来のアルゴリズムよりもノイズ除去の精度を向上できる。画像中の微弱な音波成分のみを抽出するニューラルネットワークを適用し、高精細な音の画像化が可能となる。
同研究の成果は、音の研究開発におけるセンシング手段として活用できる。騒音の評価や新たな音響デバイスの開発、従来技術の高効率化などへの貢献を見込む。
Copyright © ITmedia, Inc. All Rights Reserved.