産業技術総合研究所は、画像基盤モデルを使用して少量の内視鏡画像の学習から高精度に診断する膀胱内視鏡診断支援AIを開発した。事前学習に広く使われるデータセットを上回り、泌尿器科専門医に匹敵する精度だ。
新エネルギー・産業技術総合開発機構(NEDO)は2024年7月12日、産業技術総合研究所(産総研)が高精度な膀胱(ぼうこう)内視鏡診断支援AI(人工知能)を開発したと発表した。NEDOの委託事業「人と共に進化する次世代人工知能に関する技術開発事業」による成果だ。
開発したAIは、産総研がこれまでに同事業で開発した、数式から自動生成した大規模画像データセットを用いてAIの画像認識モデルを構築する手法を応用したものだ。膀胱内視鏡画像で確認できる膀胱粘膜の変化に着目し、異なる特徴を持つ2種類の数式から自動生成した大規模画像データセットを事前学習する。事前に学習する画像と付随情報の双方を数理モデルから生成するため、大量の実画像は必要なく、プライバシーを侵害することもない。
具体的には、表面の質感の特徴を持つデータベース「FractalDB」で生成した画像100万枚と、輪郭形状の特徴を持つ人工画像データセット「Visual Atoms」で生成した画像100万枚を合わせた大規模画像データセット200万枚を用いて、画像分類AIモデル「Vision Transfomer(ViT)」を事前学習させ、膀胱内視鏡画像向けの画像基盤モデルを構築した。さらに、膀胱内視鏡画像の病変画像を1259枚、正常画像を7553枚追加学習して診断支援AIモデル「MixFDSL-2k」を開発した。
学習していない膀胱内視鏡画像422枚を用いて検証したところ、MixFDSL-2kは感度が94.3%、特異度が99.4%、正解率は98.3%だった。この値は、事前学習に広く使われているデータセットの「ImageNet-21k」「ImageNet-1k」を事前学習に用いた場合の診断精度を上回っており、泌尿器科専門医に匹敵する精度を得られた。
Copyright © ITmedia, Inc. All Rights Reserved.