アテンション機構採用の深層学習による画期的なマテリアルズ・インフォマティクス手法の開発に成功 ―物性値の高精度予測と構造物性の明示的解釈を両立― | JAIST 北陸先端科学技術大学院大学

ニュース・イベント

プレスリリース

アテンション機構採用の深層学習による画期的なマテリアルズ・インフォマティクス手法の開発に成功 ―物性値の高精度予測と構造物性の明示的解釈を両立―

logo_jaist2021.png pr20231211-hpc.png 国立大学法人北陸先端科学技術大学院大学
HPCシステムズ株式会社

アテンション機構採用の深層学習による画期的なマテリアルズ・
インフォマティクス手法の開発に成功

―物性値の高精度予測と構造物性の明示的解釈を両立―

【ポイント】

  • 物性値の高精度予測:物質の幅広い種類の物性値に対して非常に高い精度で予測する深層学習[用語解説1]手法の開発
  • 明示的解釈の提供:アテンション機構[用語解説2]を活用した深層学習モデルにおいて、物質の物性を理解する際に注目すべき局所構造や構造特徴を明確に指示することによる材料の設計に実用的な示唆
  • 実証実験の成功:分子材料や結晶材料を対象に手法の検証を実施し、高精度な物性予測と明確な解釈の両立を確認
  • 前例のない結果:今までの手法では見られなかった高予測性と明示的な解釈性の両立の成功
  • 材料設計への応用:明示的な解釈が材料設計において実用的でこの分野において期待大

【研究概要】

 北陸先端科学技術大学院大学(学長・寺野稔、石川県能美市)共創インテリジェンス研究領域のDAM Hieu-Chi(ダム ヒョウ チ)教授NGUYEN Duong-Nguyen助教、博士後期課程学生VU Tien-Sinh、HA Minh-Quyet(研究当時)、物質・材料研究機構 木野日織博士、産業技術総合研究所 三宅隆博士、HPCシステムズ株式会社 NGUYEN Viet-Cuong博士、阿部幸浩博士、東京大学新領域創成科学研究科 津田宏治教授、Deakin大学 Truyen Tran准教授、Georgia工科大学 Huan Tran講師らの共同チームは、アテンション機構を採用した深層学習により、新たなマテリアルズ・インフォマティクス手法[用語解説3]を開発した。
 分子材料や結晶材料を対象に、この手法を適用したところ、多様な物性に対して、物性値を高精度で予測し、かつ構造物性の明示的な解釈が同時にできることが明らかとなった。
 この技術の進展は、材料設計や物質研究に革新的な可能性をもたらし、その実用的な応用に対して期待が高まる。

【研究背景】
 近年、持続可能な社会や次世代の技術革新を目指して、新規高機能材料の開発が求められている。これらの要請に応じるためには、新規高機能材料を短期間かつ効率的に開発する手法が必要だが、従来の実験ベースのアプローチでは、時間とコスト面で課題が山積している。計算科学とデータ科学の手法を組み合わせた材料開発は、これらの問題への有望な解決策として注目されてきたが、計算の複雑さ・データ解釈の難しさに起因する様々な課題が存在している。

 特に、材料の物性と背後にある構造との因果関係を解釈することは、効果的な材料設計や選択に不可欠であり、高度な専門性や知識が必要であるため、研究の時間とコストが増大する原因となっている。この課題を克服するため、ダム教授らの研究グループは、新しい高機能材料の推定された物性とその発現メカニズムを直感的に理解・解釈し、物理モデルで説明することを目的としたデータ科学アプローチの開発に取り組んでいる。

【研究内容】
 従来の材料科学の研究では、物質の構造を3次元空間での原子の配置として記述していたが、この方法ではデータ駆動型のアプローチによる自動的な構造と物性の関係性の知識抽出が難しい。ダム教授らはこの問題を克服するために、アテンション機構を取り入れた深層学習を基盤とする新たなマテリアルズ・インフォマティクス手法を開発した。

 開発した本手法は、分子構造や結晶構造の全体を適切に部分ごとに分割し、アテンション機構を用いた深層学習モデルを活用して、分子や結晶の物性値を予測する際に各部分構造への注目度を定量的に評価する(図1)。特筆すべき点として、構造中の各部分構造が互いの情報を再帰的に調査し、統一かつ一貫的にデータから学習できる点が挙げられる。このアプローチにより、材料の物性値を非常に高い精度で予測するだけでなく、それらの物性が発現する理由を明らかにすることができる。
 例えば、有機化合物の化学反応がどの原子上で起こるかを知りたい時には、長時間かかる分子軌道計算をすること無しに、瞬時に反応に関わる分子軌道を形成する部分構造として原子位置を知ることができ、また、結晶性物質の安定性にはどの原子位置が重要な役割であるかも知ることができる。このように、物質の構造における各部位への注目度を定量的に示すことで、物性と構造の複雑な関係性を直感的に理解し、計算コストの削減と新素材への理解の深化が可能となり、これにより材料開発を加速できることが期待される。

pr20231211-11.jpg

図1. アテンション機構を用いた、材料の構造情報からの物性値予測及び構造内各部位への注目度の定量的評価手法。 (a) フェノール(C6H5OH)の分子構造を例に、全体構造を各部分に分割し、各部分が相互の情報を再帰的に分析。 (b) 分析結果をもとに、統一的かつ一貫した方法でデータを学習。この手法により、材料の物性値を高精度に予測し、その発現する理由を自動的に導き出すことが可能となる。

 この材料科学分野でのアテンション機構の応用は、文章生成に使われるOpenAIのGPTシリーズ[用語解説4]や、画像生成に使われる同じくOpenAIのDALL-E[用語解説5]のような、自然言語処理や画像処理で利用されるセルフアテンション機構を使用した最近の生成モデルと密接に関連している。セルフアテンション機構は、データの内在する関係性やパターンを自動的に捉え、それを利用して新たなデータの生成に特に有効である。開発した手法は、この機構を材料科学に適用し、物質の物性予測や構造解析に新たな次元をもたらす。これは、生成モデルにおける革新的なアプローチと同様、データの深層的な理解を促進し、未来の研究や開発に新しい方向性を示している。また、アテンション機構とセルフアテンションの応用範囲を広げることで、他の多くの科学分野にも波及する可能性があり、AIとデータ科学の未来を形作る重要な一歩となることが期待される。

 本成果は、2023年12月7日に科学雑誌「npj Computational Materials」誌(Springer Nature社発行)のオンライン版で公開された。

【付記】
 本研究は、科研費 基盤研究C(20K05301)、科研費 新学術領域研究(19H05815領域代表者:入山恭寿)、科研費 基盤研究C(20K05068)、科研費 特別推進研究(23H05403)及び科学技術振興機構(JST) CREST[革新的計測解析] 反応リマスターによるエコ材料開発のフロンティア共創(研究代表者: 唯美津木、JPMJCR2235)の支援のもと行われた。

【今後の展開】
 計算科学・実験科学・データ科学の融合を一歩進めたものであり、汎用性が高く、素材開発に携わる研究者自身が使うことができ、新規材料設計や分子構造の探索等のさまざまな先端機能性材料の研究開発へ幅広く応用されることが期待できる。また、学術の面では、得られるデータからの物理化学の現象や物質の物性発現メカニズムへの深い理解が進み、さらなる材料の発見・開発や、未知の物理化学的現象の解明に極めて有用である。

【論文情報】

掲載誌 npj Computational Materials (Springer Nature社)
題目 Towards understanding structure-property relations in materials with interpretable deep learning
著者 Tien-Sinh Vu, Minh-Quyet Ha, Duong-Nguyen Nguyen, Viet-Cuong Nguyen, Yukihiro Abe, Truyen Tran, Huan Tran, Hiori Kino, Takashi Miyake, Koji Tsuda, Hieu-Chi Dam
DOI 10.1038/s41524-023-01163-9
掲載日 2023年12月7日

【用語解説】
※1深層学習:人工知能(AI)の一分野であり、複数の隠れ層を持つニューラルネットワークを使用してデータから特徴を学習する技術である。特に、大量のデータから高度なパターンや構造を自動的に捉える能力が特徴として挙げられる。

※2アテンション機構:深層学習の分野で用いられる先進的な技術の一つであり、データ内の重要な情報を自動的に「注目」することを可能にする。特に、膨大な量の情報から特定の関連性やパターンを捉える際に、その真価を発揮する。

※3マテリアルズ・インフォマティクス手法:化学産業のようなプロセス系の製造業における製品設計にデジタル技術を活用するもので、ビッグデータ、AI、機械学習などといったデジタル技術の進展により、膨大な数の実験や論文を解析して材料の製造方法を予測するなど、材料開発の効率を向上させる取り組みを指す。

※4OpenAIのGPTシリーズ:OpenAIによって開発された一連の言語予測モデルのことで、大量のテキストデータから言語のパターンを学習し、その知識を用いて新しいテキストを生成する能力を持つ。

※5OpenAIのDALL-E:OpenAIによって開発されたAI技術で、与えられたテキスト記述から対応する画像を生成することができ、複雑なアイデアやシーンを視覚化し、創造性と現実性を兼ね備えた画像を作り出すことができる。

令和5年12月11日

PAGETOP