東京理科大学は、金属錯体の結晶構造の3次元座標から構造的特徴を3次元画像として学習する手法を発案し、深層学習を用いて結晶構造データベースより抽出した約2万件のデータから単分子磁石の発見に成功した。
東京理科大学は2024年2月20日、深層学習を用いて、結晶構造の情報から約70%という高精度で単分子磁石特性があるかを予測するモデルを構築したと発表した。
このモデルを用いて結晶構造のデータベースから抽出した約2万件のデータを基に単分子磁石の発見に成功したことも公表している。複雑な構造を持つ単分子磁石分野でも、データ駆動型の材料設計が有効であることを示した。
同研究は、東京理科大学 理学部第二部化学科 教授の秋津貴城氏や滝口 裕司氏、助教の中根大輔氏の研究グループが務めた。
単分子磁石は、その名の通り1個の分子が磁石のようにふるまう物質を指し、高密度な次世代磁気メモリの実現に貢献する物質として注目されている。先行研究から、単分子磁石の磁気特性と結晶構造の関連性が示唆されてきたが、そうした関連性はあくまで個別の物質についての研究結果として提案され、結晶構造の特徴から磁気特性を予測するというアプローチはとられてこなかった。
そこで、同研究グループは、Google Scholarで、2011年以降の10年間に出版された論文を対象に「salen+ SMM(SMMは単分子磁石の略称)」というキーワードで検索し約800件の論文を抽出した。これらの論文に掲載されている金属サレン錯体の結晶構造データの中から、結晶構造と単分子磁石特性のデータを集め、データセットを構築した。
結晶構造を表現する記述子はさまざまな種類があるが、3D画像(ボクセル)は分子の3次元情報をよく保持することが報告されていることから、今回は、金属錯体を表現する記述子としてボクセルをデータセットに利用した。
このデータセットと深層学習モデル「3次元畳み込みニューラルネットワーク(3D-CNN)」を組み合わせ、分子構造に基づいて分子が単分子磁石であるかどうかを予測する二値分類モデルを構築した。結晶構造データベース「Cambridge Structural Database(CSD)」から抽出した約2万件の金属錯体結晶構造ボクセルデータを基に、二値分類モデルを用いて単分子磁石特性があるかどうかを予測した結果、約70%という高い精度で予測を的中させた。
さらに、画像内のどの部位が予測の根拠になったかを可視化する手法「Grad-CAM」を用いて検証したところ、中心金属付近に予測の根拠が集中しており、単分子磁石特性の有無を左右する部位として問題ない部分を認識できていることが分かった。この結果は、今回のアプローチが物性予測に有用で、例えばタンパク質とリガンドのドッキングや触媒作用の研究など、反応メカニズムの包括的な理解が不足している分野で有効な手段となることを示唆している。
また、学習に使用していない2万件の結晶構造をもとに、二値分類モデルで単分子磁石特性を予測したところ、最も単分子磁石らしいと予測された上位10個の金属錯体の多くは単分子磁石として報告されていることが分かった。
このことから、開発した二値分類モデルは未知のデータから単分子磁石を発見できることが判明した。単分子磁石は、高密度記憶媒体や量子コンピュータなどへの応用が期待される材料で、ナノ金属錯体分野での重要材料だ。今回の研究は、結晶構造データベースを基に、深層学習による予測が可能であることを概念実証した成果で、データ駆動型の材料設計の新たな広がりを示す。
Copyright © ITmedia, Inc. All Rights Reserved.