準結晶と近似結晶に関する大規模基盤データベースを公開マテリアルズインフォマティクス

統計数理研究所は、準結晶とその関連物質となる近似結晶に関する大規模基盤データベース「HYPOD-X」を公開した。準結晶研究に関するこれまでのデータを、一元的にデジタル化したものとなる。

» 2024年12月02日 11時00分 公開
[遠藤和宏MONOist]

 統計数理研究所は2024年11月14日、準結晶とその関連物質となる近似結晶に関する大規模基盤データベース「HYPOD-X(Hypermaterials Open Database for X)」を公開したと発表した。東京理科大学、物質・材料研究機構などとの共同研究グループによるもので、準結晶研究に関するこれまでのデータを一元的にデジタル化した。

 HYPOD-Xは、論文や書籍の図表、テキストから抽出した準結晶と近似結晶の組成、構造、物理特性に関するデータを構造化して、研究者やエンジニアが活用しやすい形式で提供する。組成データセット、相図データセット、物性データセットで構成され、手動または半自動で抽出したデータをCSV形式で配布する。

キャプション 「HYPOD-X」を構成する3つのデータセットとデータ収集手順 出所:統計数理研究所

 組成データセットは、組成、構造分類、熱処理条件を含む、準結晶と近似結晶の基本的な情報となる。専門家の検証を経てデータベースに登録するほか、エラーデータの自動抽出アルゴリズムを用いてデータの質を高めている。準結晶の組成を整理した従来研究に比べ、約10倍のデータ量を有する。

 物性データセットには、論文や書籍の図表から抽出した熱物性や電気物性、磁気物性などの温度依存性曲線が含まれる。例えば、最適な温度依存性を示す準結晶を同定して熱管理デバイスを開発するなど、同データを俯瞰することで新たな法則を見出せる可能性がある。

 相図データセットでは、論文や書籍の図を数値化したデータを提供する。準結晶や近似結晶が熱力学的に安定化する組成範囲などの条件を表すため、ML(機械学習)に同データを適用すれば、準結晶などの新たな物質相を予想できる。

 準結晶は非周期的な規則性を持つ特異物質で、近似結晶はそれと類似の組成、構造的特徴を持つ周期系物質だ。今回、大規模かつオープンなデータベースが整備されたことで、準結晶分野におけるデータ駆動型研究の展開や新たな発想、科学的法則の発見につながることが期待される。研究グループは今後も、データベースを継続的に拡張していく。

⇒その他の「マテリアルズインフォマティクス」の記事はこちら

Copyright © ITmedia, Inc. All Rights Reserved.