September 24, 2016

「マテリアルディスカバリークラウド」とは?

この記事では、exabyte.ioを始めた動機、私たちがしていることとその理由、および将来の見通しについて説明します。

この記事では、exabyte.ioを始めた動機、私たちがしていることとその理由、および将来の見通しについて説明します。

明日の世界をどのようにデザインするか、それとも「マテリアルディスカバリークラウド」とは何ですか?

イントロ

新しい材料を作るのは難しい

ほとんど目に見えないけれども、コアタスクを進めるために達成しなければならないことに多くの時間を費やしているときの気持ちはご存知でしょう。それは苦痛のように感じます。

文書化が不十分なソフトウェアを何週間もかけてブラウズしたり、不可解な例外を処理したり、FORTRANを10,000CPUで動作するように正しくコンパイルする方法を見つけたりするのが嫌でした。しかし、私がカリフォルニア大学バークレー校の大学院生だった頃、新しい独創的な科学を身につけるには、それをしなければなりませんでした。そこで一緒に働きました。 史上最高の材料物理学者の一人そして、かつて私の不満を表明しました。」簡単なことではありませんというのが即答でした。

材料シミュレーションの分野は確かに非常に複雑です。物理学、材料科学、化学、コンピューターサイエンスが組み合わされています。1 人の人間がこれらすべてに同時に秀でることは極めて困難です。しかし、そうする人は至高の恩恵を受けます。シミュレーションは、物理テストよりも桁違いに早く最終結果を出します。コンピュータ支援設計 (CAD) と電子設計自動化 (EDA) を中心に構築された業界は、これを明確に示しています。

では、何が問題なのでしょうか?

今でも、この分野は複雑なため、材料シミュレーションを始めるには大きな障壁を乗り越えなければなりません。材料の記述方法、シミュレーションの実行方法、データの収集と共有方法を規定する明確な基準はありません。この分野はまだ「中世の時代」にあります。

これは問題につながります。シミュレーションでは現実を説明できないことが多く、説明できても、その理由を特定する明確な方法がありません。失敗は、モデルの根本的な欠点 (計算能力の欠如による過度の単純化など)、ソフトウェアのバグ (コンパイラ設定の誤りなど)、または人的要因 (コンバージェンスパラメータや入力データの誤り) が原因で発生する可能性があります。そのため、実験的に確認されるまで、シミュレーションは懐疑的に行われることが多いのです。

しかし、これはすぐに変わるでしょう。

何です エクサバイト.IO?

私たちは、クラウド上で材料シミュレーションのための統合開発環境を構築しています。これには次の 4 つの主要コンポーネントがあります。

  • クラウドスケールのコンピューティングプラットフォーム、
  • インテリジェントデータ分析レイヤー,
  • 材料設計のためのWebベースのフレームワーク、
  • そして私たちの秘密兵器。

ユーザーは、ボタンをクリックするだけで、特定のケースに最適なモデルを選択し、そのモデルを数千のコンピュートノードに適用できます。この中で ケーススタディたとえば、当社のお客様は次のような規模に拡張できました 10,600 内部の CPU 7 開始から数分シミュレーション中に得られた材料とその特性を保存し、整理し、検索させます。また、当社の原子設計ツールを使用して、ユーザーが大量の新しい化合物のプロトタイプを迅速かつ効率的に作成できるようにしています。

「クラウドスケールのコンピューティングプラットフォーム」とは何ですか?

時間に追われているときは、数回クリックするだけで10,000の資料セットを一度にスクリーニングできると、大幅にスピードアップできます。いくつかの UNIX シェル・スクリプトを手作業で書き直す場合と比べてください。さらに、このような大規模なデータセットの結果を迅速に出力できるハードウェアを購入して保守する必要もあります。

クラウドコンピューティングで最もよく考えられる 2 つの要素である伸縮自在性と規模の経済性のおかげで、ユーザーは事実上無制限の計算能力を得ることができます。計算クラスターに数百万ドルを費やす代わりに、10 分の 1 の価格で同じピーク時の処理能力を継続的に利用できるようになりました。これは、各マテリアルがせいぜい12個のコンピュートノードに限定される、高スループットの実行に特に有益です。

「インテリジェントデータ分析レイヤー」とは何ですか?

では、10,000種類の資料のスクリーニングが終わったら、データをどのように保存するのでしょうか。現在のところ、データはファイルシステムに散らばっている可能性があります。データをナビゲートする唯一の方法は、ディレクトリに次のような名前を付けることです。

/alloy/li_diff/Pure_AL32Cube_PBE/FEVAC-NEB-OCT/Latscale4.5

また、15 年前に同僚が作成した perl スクリプトを使用して結果を処理し、その結果を Excel ファイルに保存して、電子メールでチームメイトと共有します。 聞き覚えがありますか?

直感的なユーザーインターフェイスを使用して、すべてのデータに1か所からアクセスおよび検索できるようにします。特定の名前が付けられた何千ものサブディレクトリをナビゲートしなくても、どのサブディレクトリがどの資料のものかを理解する必要がなくなるため、時間を大幅に節約できます。作成して蓄積したデータを使用して、関心のある新しい材料を提案できる機械学習手法を適用することもできます。

なぜ「材料設計のためのWebベースのフレームワーク」なのか?

AnsysやCadenceの製品のように使いやすいソフトウェアソリューションに進化したCAD/EDAツールとは対照的に、計算材料科学で最も広く使用されているツールは今でもコマンドラインインターフェイスです。柔軟性は最高レベルですが、そうでないユーザーにとっては効率とスピードが制限されます。 良く コマンドラインディレクティブに精通している。

ユーザーが希望すればコマンドラインディレクティブにアクセスできるようにし、高レベルの統合環境を構築しています。コマンドラインユーザーは、コンピューティングプラットフォームとデータレイヤーのスケーラビリティから価値を得ることができます。Web アプリケーションを選択したユーザーは、解決までの時間という点で戦略的に有利になります。新しい構造リードやコンビナトリアルリードの生成を効率化し、関心のある特性 (電子バンドギャップなど) を抽出するシミュレーションワークフローを簡単に構築できるようにします。

そして、あなたの秘密兵器は何ですか?

おそらく、あなたはすでに国内最高のスーパーコンピューターにアクセスしていて、昨年、家庭用電子機器を製造するフォーチュン50企業のために新しい熱電材料を発見しようとしたときに、1,800万CPU時間を費やした可能性があります。結晶ユニットセルに約1000個の原子を含む現実的な材料の大規模なデータセットについて、高精度 (実験から 1% 以内) の結果を得たいと考えています。そんなあなたには、私たちの秘密兵器がぴったりです。

アウトロ

では、明日の世界はどのように設計されるのでしょうか?

CAE/EDAで起こったように、材料シミュレーションによって設計された新製品は、私たちの日常生活に欠かせないものになるでしょう。ナノスケールでのモデリングは、すでに「ムーアを超えて」半導体技術の最新の進歩を支えています。航空宇宙/自動車セクターの人々にとって、製品フレーム、エネルギー貯蔵ソリューション、エンジン効率の向上のための新しい耐久性のある材料を実現する鍵は、シミュレーションです。化学業界や製薬業界でも同様のことが起こるでしょう。

私たちはこのビジョンを実現します。明日の世界は、長くて費用のかかる物理テストではなく、迅速で正確なモデルによって作られることを私たちは知っています。私たちは、材料モデリングへの新しいアプローチの背後にある勢いを感じており、主要な実現要因の1つとして大規模なクラウドコンピューティングが急速に台頭していると考えています。私たちは世界の大企業と提携しており、この分野で最も優秀な人材がアドバイザーを務めています。

私たちはexabyte.io — マテリアルディスカバリークラウドです。

最初に公開された https://www.linkedin.com/pulse/how-we-design-world-tomorrow-what-materials-discovery-timur-bazhirov