従来比1000倍のスピードで有機分子をデザイン、IBMが無償Webアプリで体験可能に研究開発の最前線(1/2 ページ)

日本IBMは、IBMの研究開発部門であるIBMリサーチ(IBM Research)の東京基礎研究所で開発を進めている「AI分子生成モデル」をはじめとするAccelerated Material Discovery技術について説明。AI分子生成モデルを用いた材料探索を体験できる無償のWebアプリケーション「IBM Molecule Generation Experience(MolGX)」も公開した。

» 2021年03月05日 08時00分 公開
[朴尚洙MONOist]

 日本IBMは2021年3月4日、オンラインで会見を開き、IBMの研究開発部門であるIBMリサーチ(IBM Research)の東京基礎研究所で開発を進めている「AI(人工知能)分子生成モデル」をはじめとするAccelerated Material Discovery技術について説明した。また同日から、AI分子生成モデルを用いた材料探索を体験できる無償のWebアプリケーション「IBM Molecule Generation Experience(MolGX)」を公開している。

「MolGX」のWebサイト 「MolGX」のWebサイト。日本語と英語の両対応で、Twitter、Facebook、Googleのアカウントを使えばすぐに利用できるようになっている(クリックでWebサイトへ移動)

 MolGXは、欲しい性質を持つ材料の分子形状を自動でデザインするWebアプリケーションだ。一般ユーザー向けに作られた分かりやすいユーザーインタフェースや操作性により、高度なITスキルがなくても、AIの基本を学びながら、ITを活用した材料開発技術であるマテリアルズインフォマティクスの最先端を体験することができる。

 MolGXでは、あらかじめ用意されている「QM9」と「ZINC15」というオープンに公開されている化合物のデータセットを用いる。QM9は、炭素や酸素、窒素、フッ素といった水素以外の原子を最大9個持つ分子のデータセットで、機械学習を活用したマテリアルズインフォマティクスで広く用いられている。ZINC15は、医薬品に近い有機化合物のデータセットだ。

 MolGXでの材料探索は3つのプロセスから成る。まず「データ選択」では、これらのデータセットのどちらかを選択した後、グラフ上で見たい物性値を選んでから、極端に物性値が外れている分子を除外するなどして機械学習に用いるデータの範囲を決める。

「データ選択」の画面 「データ選択」の画面(クリックで拡大)

 次の「AIの学習」では、AI学習を行う際に注目する特徴量(水素以外の原子の個数、芳香環の個数など)や、ターゲットとなる物性値、モデルの種類、過学習を防ぐための正則化のレベルなどを決めてからAI学習を実行する。このAI学習の結果として、学習データ予測結果とテストデータ予測結果の傾向が十分に合致していれば、このAIモデルを基にした「分子デザイン」に進む。

「AIの学習」で得られたAIモデルの学習データ予測結果とテストデータ予測結果の傾向 「AIの学習」で得られたAIモデルの学習データ予測結果とテストデータ予測結果の傾向(クリックで拡大)

 「分子デザイン」では、ターゲット物性値の値や分子の数、構造の制約ルールなどを入力すれば、作成したAIモデルを基に新たに分子がデザインされ、その候補が出力される。

「分子デザイン」におけるAIによるデザイン結果 「分子デザイン」におけるAIによるデザイン結果(クリックで拡大)
「MolGX」の最終画面 「MolGX」の最終画面(クリックで拡大)
日本IBMの武田征士氏 日本IBMの武田征士氏 出典:日本IBM

 MolGXの計算処理はIBMのクラウド上で実行される。会見で行われたデモンストレーションで掛かった時間は、「AIの学習」で10〜20秒、「分子デザイン」で30秒程度とかなり短い。「最後の分子デザインのステップについては、1個の分子をデザインするのに約1秒というイメージだ」(日本IBM 東京基礎研究所 マテリアル・ディスカバリー プロジェクト・リーダーの武田征士氏)という。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.