富士通研究所は、教師データなしで高次元データの特徴を正確に獲得するAI技術「DeepTwin」を開発した。情報圧縮技術と深層学習を融合し、ネットワークへの不正アクセスや、医療データの異常値をAIで検知する。
富士通研究所は2020年7月13日、教師データなしで高次元データの特徴を正確に獲得するAI(人工知能)技術「DeepTwin(ディープツイン)」を開発したと発表した。情報圧縮技術と深層学習を融合させたことで、ネットワークにおける不正アクセスや、医療データにおける異常値をAIで検知できるようになる。
近年、コスト効率の良いAI学習のために、正解ラベルを付けない教師なし学習に注目が集まっている。一方、AIによる解析の対象となる数十次元の通信データ、数百万次元の画像データといった高次元データについては、計算が指数関数的に増加する「次元の呪い」を回避するため、次元を減らしつつ、誤判定の少ない技術が求められている。
DeepTwinは、高次元のデータの削減すべき次元数と次元削減後のデータの分布を深層学習で最適化することで、教師データなしでデータの特徴を正確に捉える技術だ。
同社の情報圧縮技術を基に、分布と確率が未知の高次元データに対してニューラルネットワークに基づくオートエンコーダーで次元を削減しても、元の高次元データの特徴を正確に捉え、次元を最小限に削減できていることを数学的に証明した。
さらに、データの特徴を正確に捉えるため、高次元データの削除すべき次元数と削除後のデータの分布を制御するパラメーターを導入し、圧縮後の情報量を評価項目に定め、深層学習で最適化した。
同技術を実際の通信アクセスデータ、甲状腺数値データ、不整脈データに適用し、従来の深層学習ベースの誤り率と比較して、最大で37%改善することを確認している。
同社は、2021年度中の実用化を目指すとともに、今回の成果を同社のAI技術「FUJITSU Human Centric AI Zinrai(ジンライ)」に活用するとしている。
Copyright © ITmedia, Inc. All Rights Reserved.