富士通研究所は、教師データなしで高次元データの特徴を正確に獲得するAI技術「DeepTwin」を開発した。情報圧縮技術と深層学習を融合し、ネットワークへの不正アクセスや、医療データの異常値をAIで検知する。
富士通研究所は2020年7月13日、教師データなしで高次元データの特徴を正確に獲得するAI(人工知能)技術「DeepTwin(ディープツイン)」を開発したと発表した。情報圧縮技術と深層学習を融合させたことで、ネットワークにおける不正アクセスや、医療データにおける異常値をAIで検知できるようになる。
近年、コスト効率の良いAI学習のために、正解ラベルを付けない教師なし学習に注目が集まっている。一方、AIによる解析の対象となる数十次元の通信データ、数百万次元の画像データといった高次元データについては、計算が指数関数的に増加する「次元の呪い」を回避するため、次元を減らしつつ、誤判定の少ない技術が求められている。
DeepTwinは、高次元のデータの削減すべき次元数と次元削減後のデータの分布を深層学習で最適化することで、教師データなしでデータの特徴を正確に捉える技術だ。
同社の情報圧縮技術を基に、分布と確率が未知の高次元データに対してニューラルネットワークに基づくオートエンコーダーで次元を削減しても、元の高次元データの特徴を正確に捉え、次元を最小限に削減できていることを数学的に証明した。
さらに、データの特徴を正確に捉えるため、高次元データの削除すべき次元数と削除後のデータの分布を制御するパラメーターを導入し、圧縮後の情報量を評価項目に定め、深層学習で最適化した。
同技術を実際の通信アクセスデータ、甲状腺数値データ、不整脈データに適用し、従来の深層学習ベースの誤り率と比較して、最大で37%改善することを確認している。
同社は、2021年度中の実用化を目指すとともに、今回の成果を同社のAI技術「FUJITSU Human Centric AI Zinrai(ジンライ)」に活用するとしている。
教師データが足りないと「異常予測」は難しい、ならば「異常検知」から始めよう
機械学習で入ってはいけないデータが混入する「リーケージ」とその対策
機械学習による逆問題への対処法、材料配合や工程条件を最適化せよ
AIと機械学習とディープラーニングは何が違うのか
機械学習はどうやって使うのか――意外と地道な積み重ね
韓国AIベンチャーの挑戦、少ない学習データで金属部品の外観検査精度99%を実現Copyright © ITmedia, Inc. All Rights Reserved.
組み込み開発の記事ランキング
コーナーリンク
よく読まれている編集記者コラム