計算ノード Arm の 性能評価
ヒトゲノム解析センターでは、Shirokane6 から部分的に Arm アーキテクチャ CPU の計算ノードを導入しています。 Arm アーキテクチャ CPU は、AMD や Intel が作るメジャーな CPU よりも比較的コア数が多く、電力効率が良い (省電力) ことが特徴の CPU で、富岳スパコンが Arm アーキテクチャ CPU を採用したことでも注目を浴びました。 近年、ユーザ数が急激に増加している SHIROKANE では全体の CPU コア数の確保が課題になっており、多くのコアを省電力で稼働できる Arm アーキテクチャ CPU を搭載したサーバを Shirokane6 で導入していました。 今回は、導入から 1 年が経ちその実行性能や消費電力の実力が見えてきましたので、ご紹介します。
Bio ツールの実行性能
SHIROKANE で利用されることが多い BLAST、BWA、SAMTools sort、SiGN-BN NNSR の 4 つのツールの実行性能を Shirokane5 計算ノード Thin、Shirokane6 計算ノード Thin、計算ノード Arm で比較しました。 サーバのスペック、実行環境は下記のとおりです。
実行環境
項目 | Shirokane5 計算ノード Thin (gc007) | Shirokane6 計算ノード Thin (rc032) | 計算ノード Arm (rca38) |
---|---|---|---|
CPU | Intel Xeon Gold 6154@3.00GHz x2 (18 core x2, HT 有効) TDP:200W Release:Q3/2017 | AMD EPYC 7713@2.0GHz x2 (64 core x2, SMT 無効) TDP:225-240W Release:3/15/2021 | Ampere Altra Q80-30@2.8GHz (80 core x1) TDP:210W Release:9/18/2020 |
OS | RedHat Enterprise Linux Server 7.8 | RedHat Enterprise Linux Server 8.5 | SUSE Linux Enterprise Server 15 SP3 |
コンパイラ | gcc (GCC) 7.3.0 | gcc (GCC) 8.5.0 | gcc (SUSE Linux) 7.5.0 |
4 つのツールごとにモデルケースを作成し、実行完了までの時間を測定しました。時間が短い方が性能が良いといえます。測定は、どの計算ノードでも 36 スレッドに固定した場合 (チャート中の水色) とそれぞれの計算ノードの最大スレッド (gc007 では 72 スレッド、 rc032 では 128 スレッド、 rca38 では 80 スレッド) での場合 (チャートの橙色) について、行いました。
今回の計算ノード Arm の Arm アーキテクチャ CPU は Shirokane5 計算ノード Thin の CPU よりも周波数が低いものですが、BWA や SAMTools sort では 36 スレッドに揃えた比較では計算ノード Arm が短時間で実行を終えました。各 CPU の最大スレッドでの比較では SiGN-BN NNSR の場合に、計算ノード Armの CPU コア数の多さに優位性が見えます。
ワットパフォーマンス
これらのツールを実行したときのワットパフォーマンスを、性能値 (実行時間の逆数×10万)/消費電力 [W] で表しました。ワットパフォーマンスとは、入力されるエネルギー(電力)に対して、どれくらい処理を行えるかを表す値で、ワットパフォーマンスが高いほど処理効率が良いといえます。
いずれのツールでも計算ノード Arm の実行性能に対する消費電力 (ワットパフォーマンス) は少なく、”省電力” であることが実証できました。今回検証したのは 4 ツールのみですが、今後 Arm アーキテクチャ CPU を搭載したサーバが増えていくと SHIROKANE 全体の消費電力を低減できるでしょう。
まとめ
1 年間の稼働で、Arm アーキテクチャ CPU の消費電力は他の CPU よりも低いこと、バイオインフォマティクス分野で利用するツールにも適用できる実行性能を持つことが見えてきました。 SHIROKANE の運用において、計算ノード Arm にインストールしているツールは稼働当初から 2 倍 (2023 年 4 月現在 98 ツール) に増加しており、動作可能なツールは他の CPU を搭載した計算ノード Thin に近づいています。今後 SHIROKANE では 2024 年 4 月頃に稼働予定の新しいシステムでも、Arm アーキテクチャ CPU を搭載したサーバを拡充予定です。現在の SHIROKANE では、無料コースと試用コースを除く全てのコースに 2,880 スロットの計算ノード Arm があり、多くの利用者が手続きなく計算ノード Arm を使用できます。