教師データなしで異常値を検出できるAI技術を開発：人工知能ニュース

富士通研究所は、教師データなしで高次元データの特徴を正確に獲得するAI技術「DeepTwin」を開発した。情報圧縮技術と深層学習を融合し、ネットワークへの不正アクセスや、医療データの異常値をAIで検知する。

[MONOist] PC用表示関連情報

LINE

Hatena

　富士通研究所は2020年7月13日、教師データなしで高次元データの特徴を正確に獲得するAI（人工知能）技術「DeepTwin（ディープツイン）」を開発したと発表した。情報圧縮技術と深層学習を融合させたことで、ネットワークにおける不正アクセスや、医療データにおける異常値をAIで検知できるようになる。

　近年、コスト効率の良いAI学習のために、正解ラベルを付けない教師なし学習に注目が集まっている。一方、AIによる解析の対象となる数十次元の通信データ、数百万次元の画像データといった高次元データについては、計算が指数関数的に増加する「次元の呪い」を回避するため、次元を減らしつつ、誤判定の少ない技術が求められている。

　DeepTwinは、高次元のデータの削減すべき次元数と次元削減後のデータの分布を深層学習で最適化することで、教師データなしでデータの特徴を正確に捉える技術だ。

　同社の情報圧縮技術を基に、分布と確率が未知の高次元データに対してニューラルネットワークに基づくオートエンコーダーで次元を削減しても、元の高次元データの特徴を正確に捉え、次元を最小限に削減できていることを数学的に証明した。

データの特徴を正確に獲得する理論フレームワーク（クリックで拡大）出典：富士通研究所

　さらに、データの特徴を正確に捉えるため、高次元データの削除すべき次元数と削除後のデータの分布を制御するパラメーターを導入し、圧縮後の情報量を評価項目に定め、深層学習で最適化した。

深層学習を用いた次元削減技術（クリックで拡大）出典：富士通研究所

　同技術を実際の通信アクセスデータ、甲状腺数値データ、不整脈データに適用し、従来の深層学習ベースの誤り率と比較して、最大で37％改善することを確認している。

　同社は、2021年度中の実用化を目指すとともに、今回の成果を同社のAI技術「FUJITSU Human Centric AI Zinrai（ジンライ）」に活用するとしている。

教師データなしで異常値を検出できるAI技術を開発：人工知能ニュース

関連記事

関連リンク