計算ノード Arm の 性能評価

ヒトゲノム解析センターでは、Shirokane6 から部分的に Arm アーキテクチャ CPU の計算ノードを導入しています。 Arm アーキテクチャ CPU は、AMD や Intel が作るメジャーな CPU よりも比較的コア数が多く、電力効率が良い (省電力) ことが特徴の CPU で、富岳スパコンが Arm アーキテクチャ CPU を採用したことでも注目を浴びました。 近年、ユーザ数が急激に増加している SHIROKANE では全体の CPU コア数の確保が課題になっており、多くのコアを省電力で稼働できる Arm アーキテクチャ CPU を搭載したサーバを Shirokane6 で導入していました。 今回は、導入から 1 年が経ちその実行性能や消費電力の実力が見えてきましたので、ご紹介します。

Bio ツールの実行性能

SHIROKANE で利用されることが多い BLAST、BWA、SAMTools sort、SiGN-BN NNSR の 4 つのツールの実行性能を Shirokane5 計算ノード ThinShirokane6 計算ノード Thin計算ノード Arm で比較しました。 サーバのスペック、実行環境は下記のとおりです。

実行環境

項目Shirokane5 計算ノード Thin (gc007)Shirokane6 計算ノード Thin (rc032)計算ノード Arm (rca38)
CPUIntel Xeon Gold 6154@3.00GHz x2 (18 core x2, HT 有効)
TDP:200W
Release:Q3/2017
AMD EPYC 7713@2.0GHz x2 (64 core x2, SMT 無効)
TDP:225-240W
Release:3/15/2021
Ampere Altra Q80-30@2.8GHz (80 core x1)
TDP:210W
Release:9/18/2020
OSRedHat Enterprise Linux Server 7.8RedHat Enterprise Linux Server 8.5SUSE Linux Enterprise Server 15 SP3
コンパイラgcc (GCC) 7.3.0gcc (GCC) 8.5.0gcc (SUSE Linux) 7.5.0

4 つのツールごとにモデルケースを作成し、実行完了までの時間を測定しました。時間が短い方が性能が良いといえます。測定は、どの計算ノードでも 36 スレッドに固定した場合 (チャート中の水色) とそれぞれの計算ノードの最大スレッド (gc007 では 72 スレッド、 rc032 では 128 スレッド、 rca38 では 80 スレッド) での場合 (チャートの橙色) について、行いました。

x86 (Intel, AMD), Arm アーキテクチャ CPU 搭載サーバの Bio ツール実行性能 (縦軸: sec)

今回の計算ノード Arm の Arm アーキテクチャ CPU は Shirokane5 計算ノード Thin の CPU よりも周波数が低いものですが、BWA や SAMTools sort では 36 スレッドに揃えた比較では計算ノード Arm が短時間で実行を終えました。各 CPU の最大スレッドでの比較では SiGN-BN NNSR の場合に、計算ノード Armの CPU コア数の多さに優位性が見えます。

ワットパフォーマンス

これらのツールを実行したときのワットパフォーマンスを、性能値 (実行時間の逆数×10万)/消費電力 [W] で表しました。ワットパフォーマンスとは、入力されるエネルギー(電力)に対して、どれくらい処理を行えるかを表す値で、ワットパフォーマンスが高いほど処理効率が良いといえます。

x86 (Intel, AMD), Arm アーキテクチャ CPU 搭載サーバの Bio ツール実行中の消費電力 (縦軸: ワットパフォーマンス※)
※ワットパフォーマンスは、(定数 100,000 / ツール 実行時間 [sec]) / 消費電力 [W]

いずれのツールでも計算ノード Arm の実行性能に対する消費電力 (ワットパフォーマンス) は少なく、”省電力” であることが実証できました。今回検証したのは 4 ツールのみですが、今後 Arm アーキテクチャ CPU を搭載したサーバが増えていくと SHIROKANE 全体の消費電力を低減できるでしょう。

まとめ

1 年間の稼働で、Arm アーキテクチャ CPU の消費電力は他の CPU よりも低いこと、バイオインフォマティクス分野で利用するツールにも適用できる実行性能を持つことが見えてきました。 SHIROKANE の運用において、計算ノード Arm にインストールしているツールは稼働当初から 2 倍 (2023 年 4 月現在 98 ツール) に増加しており、動作可能なツールは他の CPU を搭載した計算ノード Thin に近づいています。今後 SHIROKANE では 2024 年 4 月頃に稼働予定の新しいシステムでも、Arm アーキテクチャ CPU を搭載したサーバを拡充予定です。現在の SHIROKANE では、無料コースと試用コースを除く全てのコースに 2,880 スロットの計算ノード Arm があり、多くの利用者が手続きなく計算ノード Arm を使用できます。

関連リンク

You may also like...