January 22, 2019

クラウドインフラストラクチャのパフォーマンスの共同評価

クラウドコンピューティングは最近、ハイパフォーマンスコンピューティング (HPC) アプリケーションを実行するためのオンプレミスシステムに代わる実行可能な代替手段として発展しました。

クラウドコンピューティングは最近、ハイパフォーマンスコンピューティング (HPC) アプリケーションを実行するためのオンプレミスシステムに代わる実行可能な代替手段として発展しました。新しいベンダーやハードウェアオプションの登場により、最も一般的に使用されているシミュレーションワークフローを基準に、インフラストラクチャのパフォーマンスを継続的に評価する必要性が高まっています。

そのため、オンラインエコシステムを導入し、実際のアプリケーション固有の複数のベンチマークケースについて、クラウドとオンプレミスのハードウェアのパフォーマンスを協調的かつ反復可能な方法で評価することを目的としたツールをオープンソース化しています。

ここでは、エコシステムの構成要素とそれに対する私たちのビジョンを簡単に説明し、読者に以下を紹介します。 オリジナル原稿 [1] と関連リソース [2、3] は以下に記載されています。

エコシステム

エコシステムは、リソースを大量に消費するアプリケーションのコンピューティングハードウェアのパフォーマンスを複数の人が共同で評価できるオンラインプラットフォームです。エコシステムは次のコンポーネントで構成されています。

  • エクサベンチ [2] は、コンピューティングシステムのパフォーマンス評価を容易にするオープンソースのモジュラーソフトウェアツールです。このツールは、科学アプリケーションのパフォーマンスを評価するための複数のベンチマークケースをサポートしています。
  • 結果データベースは、結果の比較、トレーサビリティ、およびキュレーションを容易にするために、結果を保存するための一元的にアクセス可能なリポジトリです。
  • 結果ページ、結果を視覚的に表示するオンラインリソース [3]。
  • サイト、またはベンチマークが実行される一意の識別子を持つ物理的な場所。
  • コントリビューターは、Exabenchツールを使用してベンチマーク結果を中央データベースに送信したり、新しいベンチマークケースやメトリクスのサポートを追加してExabenchのソースコードに貢献したりしています。
  • コミュニティ、より幅広いユーザーと利害関係者。

エコシステムのアーキテクチャを図1に示します。サイトの管理者は、オンラインで入手可能なソースコードから Exabench ツールをインストールします。このソースコードは、コードベースのコントリビューターによって継続的に開発、保守されています。ベンチマークは基盤となるハードウェア上で実行され、その結果は特定の形式でデータベースに自動的に保存され、コミュニティはコンピューティングシステムの効率性を分析できます。

図-1: オンラインエコシステムの概略図。中央には、オープンソースのコードベース、結果データベース、およびそれらのオンラインでの視覚的表現という3つの主要コンポーネントの概要が示されています。「EB」は ExaBench ツールを表します。「クラスタ」とは、オンプレミスのコンピューティングクラスタを指します。「クラウド」はパブリック/プライベートクラウドシステムを指します。コントリビューターには、コードベースへのコントリビューター (オレンジ色) と結果へのコントリビューター (緑色) の 2 つのタイプが表示されます。コードベースのコントリビューターはテストケースの拡張を支援します。リザルトコントリビューターは Exabench ツールを実行し、その結果を一元的にアクセス可能なデータベースに公開します。結果はより広いコミュニティに公開されます。

展望と展望

従来の半導体技術のスケーリングにおけるムーアの法則の終焉により、今日の高性能並列コンピューティングはかつてないほど重要になっています。HPC はもはや、高度に専門化されたアプリケーションだけの領域ではありません。後者はまだ存在し、必要とされていますが、徐々に少数派になりつつあります。そのため、またタイムリーで客観的な知見を得るためには、継続的な共同作業による業績評価の重要性が現在強く残っており、今後もさらに増していくでしょう。現在、私たちがエコシステムに組み込んだアプリケーションは限られていますが、ソースコードを拡張して結果を提供することで、計算流体力学、電子設計自動化、創薬、計算化学などにおけるさらに多くのユースケースを導入できます。

エコシステムは、コミュニティがリソースを大量に消費するワークロードを実行するための最適なセットアップを選択するのに役立ち、クラウドベンダーが競争力のある透明な環境でサービスを改善できるようになることを想定しています。このような環境が HPC のさらなる民主化と産業研究開発の普及にどのようにつながり、ひいては該当する業界の進歩を加速させることができるかがわかります。

参考文献

[1] エクサバイトベンチマークエコシステム原稿、arxiv.org

[2] エクサバイトベンチマークスイート、GitHub リポジトリ

[3] エクサバイトベンチマークスイートの結果、Google スプレッドシート