January 24, 2024

マテリアルズ・インフォマティクスとは?

リチャード・ファインマンはかつて、量子力学を本当に理解している人は誰もいないと言っていました。今日では、マテリアルズ・インフォマティクスについても同じことが言えます。業界は混乱を招きやすく、「リンゴ」は「オレンジ」とよく比較され、間違ったソリューションのリサーチやテストに時間を浪費することになります。Mat3ra.com (旧称Exabyte.io) は、「マテリアルズ・インフォマティクス」という用語が存在する前から設立されており、この業界の台頭を直接体験してきました。実際、Mat3raは2023年だけで少なくとも4回、マテリアルズ・インフォマティクス業界の主要企業の間で言及されてきましたが、それでもこの用語の意味についてはまだ混乱しています。その理由は?読み進めて調べてください。

2023年、メタ、グーグル、マイクロソフト [1-3] は、急速に成長しているマテリアルズ・インフォマティクスの分野 [4,5] の主要なニュースメーカーの一部でした。

しかし、マテリアルズ・インフォマティクスとは正確には何を意味し、なぜそれが重要なのでしょうか。

リチャード・ファインマンはかつて、「量子力学を本当に理解している人は誰もいないと言っても過言ではない」と言いました。今日、マテリアルズ・インフォマティクスについても同じことが言えます。市場アナリスト、ベンチャーキャピタリスト、企業幹部、スタートアップの創業者、その他業界に関わるすべての人は、「リンゴ」が「オレンジ」とよく比較される混乱した環境で活動しています。その結果、間違ったソリューションのリサーチやテストに時間が無駄になります。

私は「マテリアルズ・インフォマティクス」という言葉が出る前にMat3raを始め、業界の台頭を直接体験してきました。2023年、Mat3ra.com (fka Exabyte.io) はマテリアルズ・インフォマティクス業界の主要企業の間で少なくとも4回言及されました [4] が、私でさえその用語の意味がわからないのです!そこで、私が説明してみました。

1。ちょっとした歴史。

「マテリアルズ・インフォマティクス(Materials Informatics)」という用語は、主にラックス・リサーチがこの新たな状況を追跡し始めた2017年頃に勢いを増しました。マテリアルズ・インフォマティクスのタイムラインの概要は次のとおりです。

2000年代:ファンダクション・ピリオド

  • 情報学を材料科学に適用するという概念が勢いを増し始めました。この時期は、エネルギー、半導体、製造などの産業の材料科学において、データ主導型のアプローチをどのように活用できるかを探る基礎研究が行われています。
  • 基礎を築く重要な論文の出現。これらの論文では、データベースと計算手法を使用して材料特性を分析および予測することの可能性について論じています。

2010年代:成長と発展

  • 2010-2013: 材料科学における機械学習と人工知能の統合について論じた出版物の増加に伴い、この分野は急速に発展しています。オバマ政権がMaterials Genome Initiative(MGI)を立ち上げ、材料科学における計算ツールの統合を促進することでこの分野を大きく後押ししました。
  • 2014-2016: Materials Project、AFlowLibなどの重要な材料データベースが出現し、研究開発に不可欠なデータが提供されています。
  • 2017: Lux Researchは、マテリアルズ・インフォマティクスの現状を追跡し始め、この分野が正式に認められたことを記念しています [6]。今年は、産業界や学術界の注目が高まる中、マテリアルズ・インフォマティクスの歴史における極めて重要な年とよく言われます。
2017年頃のLux Researchによるマテリアルズ・インフォマティクスに関する初期リリース。

2020年代:急速な進歩と多様化

  • 2020-2023: 材料科学に特化した機械学習とAI技術のさらなる進歩。この時期には、材料情報学の応用が多様化し、電池開発、再生可能エネルギー、バイオテクノロジーなどの分野にまで広がっています。

2。方法論。

2.1。メジャートレンド。

今日、材料情報学について話しているのは、研究開発、つまりデータ主導型の研究という新しいパラダイムの出現によるものです。以前は、(1) 実験、(2) 理論とペンと紙による解析方程式の解法、(3) 解けないものを計算できるコンピューターシミュレーションに頼ることができました。最近では、(1)-(3) で作成されるデータが十分にあるため、その傾向がわかり、科学的な知見を得るためにAI/MLの手法に頼るようになりました。このように、マテリアルズ・インフォマティクス業界の関係者はみな、私たちが経験しているこの複雑な「構造的」シフトの複数の側面を代表しており、何千回もの高価で時間のかかる実験を行わなければならなかった「エジソニアン」アプローチから、計算とAIによって導かれる「アインシュタニアン」アプローチへの移行を促進することを目指しています。

データおよびAI/ML主導の研究開発パラダイムの出現は、材料情報産業の成長を支える主要な推進力です。

同様に、この分野のすべてのソリューションは、(1)材料科学と化学、(2)データサイエンス、(3)コンピューターサイエンスの3つのドメインのうち2つ以上に関係しています。

デジタルマテリアルの研究開発に関わる科学分野。マテリアルズ・インフォマティクスの専門分野は多岐にわたります。

2.2。特徴を際立たせる。

今日は「マテリアルズ・インフォマティクス」に分類される研究開発分野を具体的に見ていきましょう。問題空間を領域に「分解」しやすくするために、以下のベクトルを提案します。

  1. 主なデータ源:(1) 実験、(2) コンピュータシミュレーション。これは、ソリューションが採用している基本的な研究開発パラダイムを反映しています。ほとんどの実用的な材料科学では、実験からしか情報を得ることができません。なかには、密度汎関数理論 (DFT) のような物理ベースのシミュレーションが使えるものもあります。ソリューションの中には、実験データと計算データの両方を組み合わせることを目的とするものもあります。ただし、いずれかが常に普及しており、50/50 の分割はありません。
  2. 新しい独立データを生成する機能:(1) 存在する、(2) 存在しない ここでは、結果として得られるAI/ML技術の改良に貢献できる新しいデータを生成する方法がソリューションによって提供できるかどうかを追跡します。ML モデルは新しいデータを生成する可能性があるため、これは混乱を招く可能性があります。しかし、私たちが「独立」を使うのには理由があります。どの ML モデルでも、それ自体を改善するには、そのモデル以外のトレーニングデータが必要だからです。そうしないと、ミュンヒハウゼン男爵が自分の髪の毛で沼地から抜け出してしまいます。機械学習モデルとは無関係にデータを生成する自動運転ラボや物理ベースのシミュレーションプラットフォームは、決定的な利点をもたらします。
  3. 研究開発の重点段階:(1)初期段階、(2)中間段階、(3)後期段階。 明確に言うと、「アーリーステージ」とは、創造性の高い研究であり、多くの設計およびプロトタイピング能力を必要とし、学術研究に近い状態を維持することを意味します。「ミッドステージ」とは、製造、ビジネス、製品の能力に直接影響する創造的な研究が少ないことを意味します。「後期段階」には主に、製造プロセスの収率の最適化など、ビジネスや製品に直接影響する創造性の低い作業が含まれます。
  4. 特定のアプリケーション領域に焦点を当てます:(1)深い、(2)浅い、(3)なし。 ここでは、ソリューションをあるアプリケーション領域から別のアプリケーション領域にどの程度移転できるかを検討します。「深く」焦点を当てたソリューションの例は、「鉄系高温超伝導体」などの特定の狭い領域のみに集中しています。たとえば、「浅い」焦点が当てられているのは、ユーザーがすべての電子材料を研究できるようにすることです。焦点が絞られていないのは、あらゆる材料の (明らかに深さが限られている) 研究を改善する方法を提供する水平解法です。
  5. 根幹科学分野:(1) コンピュータサイエンス/ハイパフォーマンスコンピューティング、(2) 材料と化学、(3) データサイエンス、(4) 3つの交差点。ここでは、ソリューションの起源を3つの科学分野のうちの1つまでたどります。通常は製品内でより顕著になります。ここで紹介する4つ目の選択肢は例外で、ソリューションの焦点は学問分野間の「架け橋」を築くことです。
  6. その他の考慮事項:
  • 会社/製品開発段階:(1)初期、(2)中期、(3)成熟。
  • 顧客とのやりとりのレベル:(1) 販売/サポートの監視が不要なセルフサービス型SaaS、(2) 営業/サポート担当者を必要とするハイタッチなエンタープライズ展開、(3) コンサルティングベースのエンゲージメント。
  • コラボレーションレベル:(1) グローバルオンラインプラットフォーム、(2) ローカル組織レベルの展開、(3) なし (スタンドアロンソフトウェアアプリケーション)

すでに複雑な状況を複雑にしすぎないように、上記のすべてを関係する材料の種類(電子材料、金属、セラミック、化学薬品、複合材料、ポリマー、その他)に応じてさらに細分化できます。

また、注目すべきは、アイテム #2 上記は、より確立された「コンピューター支援設計」および「コンピューター支援エンジニアリング」産業と重複しています。これらの産業は、数十年にわたって存在していましたが、材料および化学分野への浸透度は(機械工学や電気工学などと比較して)比較的小さかったです。

3。キープレーヤーとサブクラス分け。

3.1。競争環境。

話を続ける前に、以下の考えは私の個人的な経験とこの分野への理解を反映したものであり、業界の客観的な状態や他のプレーヤーの見方を正確に表すものではないことを繰り返しておきます。オンライン情報は、特にハイタッチ/コンサルティングソリューションでは限られていることが多いです。とはいえ、ここではマテリアルズ・インフォマティクスの「プレイフィールド」と、上記の分類に基づいてどのようなソリューションが成立するかを紹介しようと思います。

マテリアルズ・インフォマティクスの展望:業界内およびそれに関連する一部のプレーヤーと、それに対応する特性(上記3.2の分類)。

3.2。サブクラス分け。

マテリアルズ・インフォマティクスの業界は1つではありません。市場調査の専門家の努力にもかかわらず、全員を1つのバケツにまとめるよりも、そうする方が良いだろう。」ディバイド・アンド・コンカー「。

マテリアルズ・インフォマティクスを理解する上での課題の1つは、その幅広い応用と解釈にあります。現在、この用語には、根本的に異なる多くの企業や技術が含まれています。この多様性を理解するには、以下のディメンションで分類する必要があります。

I. 独立したデータ合成

  1. (物理ベースの) データ合成ソリューション: これらは、物理ベースのアプローチによるデータ作成に重点を置いており、基本的な科学的原理に基づいた洞察を提供します。ハイスループット実験を行う自動運転型の実験室もここに置くことができます。
  2. データ分析ソリューション: これには、顧客から提供された既存のデータを分析し、既存のデータセットから貴重な情報を抽出することが含まれます。

II。ブラックボックスソリューションとオープンプラットフォーム

  1. ブラックボックス AI/ML ツール: このようなツールは、人工知能と機械学習を「ブラックボックス」方式で使用し、ユーザーが基礎となるメカニズムを理解しなくてもソリューションを提供します。
  2. 複数のツールチェーンを備えたオープンプラットフォーム: これらのプラットフォームは、マテリアルズ・インフォマティクスのさまざまなアプローチを促進するさまざまなツールと機能を提供します。

III。水平型ソリューションと垂直型ソリューション

  1. 水平 複数の材料分野にまたがるソリューションと
  2. 垂直 特定の材料分野に焦点を当てたソリューション。

上記の 3 つはすべてを網羅しているわけではありませんが、さまざまなサービスをより明確に区別できるはずです。AI/ML ツールチェーンの外部でデータ合成を実行できることが、重要な差別化要因です。AI/ML もデータを生成するため、多くの部外者は違いを理解するのが難しいと感じています。しかし、AI/MLが生成したデータのみを使用してより多くのAI/MLをトレーニングすることは、「因果関係」の原則に違反します。だからこそ、3.1 の図の他のレイヤーからのインプットが必要なのです。実際の多くのケースでは、必要な量、速度、多様性、信憑性のデータを提供できるのは、物理ベースのシミュレーション (AI/ML で高速化できる場合もあります) だけです。

4。ワイルド・ワイルド・ウェストで金メダルを獲得!

結論として、 マテリアルズ・インフォマティクス は、AI/MLを含むデータ主導のデジタルアプローチの作成、展開、交換を促進する研究分野です。中核となるのは、(I) 結果として得られるAI/MLとは無関係にデータ合成を可能にするアプローチと、(II) 唯一のデータ分析アプローチの 2 つに細分化できます。

マテリアルズ・インフォマティクスの重要性さて、あなたが触れるものはすべて素材です。新しい材料の発見と開発の方法をわずかな差で改善できれば、脱炭素化、汚染の削減、再生可能エネルギーへの移行、ムーア以外の電子機器などの重要な分野を含め、私たちの生活の多くの側面に直接影響を与えることができます。マテリアルズ・インフォマティクスは、材料の発見、開発、応用の方法を変革する極めて重要な分野であり、現代の科学技術において極めて重要な分野となっています。

マテリアルズ・インフォマティクスは、今日の西部開拓時代のようなものです。この広大な未知の領域は、最近ビッグテックの関心を呼んでいます。可能性に満ちた分野ですが、複雑でわかりにくい分野でもあります。今日では、量子力学の初期の頃のように、何が起こっているのかを真に理解している人は誰もいません。それを理解し、より早く前進するためには、「カリフォルニア」、「アリゾナ」、「ニューメキシコ」など、ワイルドワイルドウェストの個々の州を細分化して境界線を引き、時間の無駄や期待を裏切らないようにする必要があります。細分化して注意を集中させることで、状況をより早くナビゲートし、画期的な発見への道を開くことができます。

リンク。

  1. (1) リサーチ・アンド・マーケットからの市場調査データ https://www.researchandmarkets.com/report/material-informatics; (2) 価値市場調査 https://www.valuemarketresearch.com/report/material-informatics-market; (3) インダストリー・アーク https://www.industryarc.com/Report/19609/material-informatics-market.html; (4) オープンPR https://www.openpr.com/news/3213126/global-material-informatics-market-size-share-and-forecast
  2. 優先調査、マテリアルズ・インフォマティクス市場予測: https://www.precedenceresearch.com/material-informatics-market
  3. 「オープンカタリスト」プロジェクトに関するメタAIリサーチ https://ai.meta.com/research/impact/open-catalyst/
  4. Google DeepMind が GNOME と AI による材料発見の加速について: https://deepmind.google/discover/blog/millions-of-new-materials-discovered-with-deep-learning/
  5. マイクロソフトリサーチの MatterGen、AI 主導の材料設計: https://www.microsoft.com/en-us/research/blog/mattergen-property-guided-materials-design/
  6. マテリアルズ・インフォマティクスに関するラックス・リサーチのニュースリリース、2017/08/08: https://www.globenewswire.com/news-release/2017/08/08/1081561/0/en/Materials-Informatics-is-a-Disruptive-Technology-for-Chemicals-and-Materials-R-D-Says-Lux-Research.html


---

注:この記事は元々次の場所で公開されました https://www.linkedin.com/pulse/wth-materials-informatics-timur-bazhirov-sophc