クラウドコンピューティングは最近、ハイパフォーマンスコンピューティング (HPC) アプリケーションを実行するためのオンプレミスシステムに代わる実行可能な代替手段として発展しました。
クラウドコンピューティングは最近、ハイパフォーマンスコンピューティング (HPC) アプリケーションを実行するためのオンプレミスシステムに代わる実行可能な代替手段として発展しました。新しいベンダーやハードウェアオプションの登場により、最も一般的に使用されているシミュレーションワークフローを基準に、インフラストラクチャのパフォーマンスを継続的に評価する必要性が高まっています。
そのため、オンラインエコシステムを導入し、実際のアプリケーション固有の複数のベンチマークケースについて、クラウドとオンプレミスのハードウェアのパフォーマンスを協調的かつ反復可能な方法で評価することを目的としたツールをオープンソース化しています。
ここでは、エコシステムの構成要素とそれに対する私たちのビジョンを簡単に説明し、読者に以下を紹介します。 オリジナル原稿 [1] と関連リソース [2、3] は以下に記載されています。
エコシステムは、リソースを大量に消費するアプリケーションのコンピューティングハードウェアのパフォーマンスを複数の人が共同で評価できるオンラインプラットフォームです。エコシステムは次のコンポーネントで構成されています。
エコシステムのアーキテクチャを図1に示します。サイトの管理者は、オンラインで入手可能なソースコードから Exabench ツールをインストールします。このソースコードは、コードベースのコントリビューターによって継続的に開発、保守されています。ベンチマークは基盤となるハードウェア上で実行され、その結果は特定の形式でデータベースに自動的に保存され、コミュニティはコンピューティングシステムの効率性を分析できます。
従来の半導体技術のスケーリングにおけるムーアの法則の終焉により、今日の高性能並列コンピューティングはかつてないほど重要になっています。HPC はもはや、高度に専門化されたアプリケーションだけの領域ではありません。後者はまだ存在し、必要とされていますが、徐々に少数派になりつつあります。そのため、またタイムリーで客観的な知見を得るためには、継続的な共同作業による業績評価の重要性が現在強く残っており、今後もさらに増していくでしょう。現在、私たちがエコシステムに組み込んだアプリケーションは限られていますが、ソースコードを拡張して結果を提供することで、計算流体力学、電子設計自動化、創薬、計算化学などにおけるさらに多くのユースケースを導入できます。
エコシステムは、コミュニティがリソースを大量に消費するワークロードを実行するための最適なセットアップを選択するのに役立ち、クラウドベンダーが競争力のある透明な環境でサービスを改善できるようになることを想定しています。このような環境が HPC のさらなる民主化と産業研究開発の普及にどのようにつながり、ひいては該当する業界の進歩を加速させることができるかがわかります。
[1] エクサバイトベンチマークエコシステム原稿、arxiv.org
[2] エクサバイトベンチマークスイート、GitHub リポジトリ
[3] エクサバイトベンチマークスイートの結果、Google スプレッドシート