SHIROKANE の AGE には、用途に応じて下記のキューが用意されています。ユーザがキューを直接選択することは web.q
以外になく、もっぱら リソースにより間接的にキューを選択します。
- ljobs.q
- 計算ノード Thin に作られた、実行時間の上限が 62 日のキューです。計算に長時間かかるジョブのためにあります。
- mjobs.q、mjobs_rerun.q
- デフォルトの、計算ノード Thin に作られた、実行時間の上限が 2 日のキューです。
- intr.q
- インタラクティブキュー。対話式ジョブの実行やバッチジョブの作成・デバッグのためにあります。計算ノード Thin に作られています。無操作状態が 6 時間続くと自動でログアウトされます。
- lmem.q
- 計算ノード Fat に作られた、実行時間の上限が 14 日のキューです。
- web.q
- Web サービスで使用するキューです。
- cp.q
- データをコピーするためのキューです。qrecall でも使用されるキューです。cp、rsync 等データコピーのみのジョブスクリプトを実行する場合に限り利用できます。 1 ユーザあたりの上限が 2 です。パラレルエンヴァイロメントを要求するジョブは実行できません。
- gpuv.q
- Tesla V100 (GPU) 搭載ノードを使用するキューです。 Tesla V100 (GPU) の使い方
- gpua.q
- NVIDIA A100 (GPU) 搭載ノードを使用するキューです。 NVIDIA A100 (GPU) の使い方
- gpuh.q
- NVIDIA H100 (GPU) 搭載ノードを使用するキューです。 NVIDIA H100 (GPU) の使い方
- 専有キュー
- キューの名前は、計算ノード Thin に作られたキューです。実行時間に制限はありません。利用コースによって割当量が違い、割当がないコースもあります。グループの利用者が専有して利用できるキューです。 .q です。
- arm.q
- ARM アーキテクチャ の CPU を搭載した 計算ノード Arm を使用するキューです。
- intra.q
- 計算ノード Arm のインタラクティブキュー。Arm アーキテクチャの CPU を搭載したノードで対話式ジョブの実行やバッチジョブの作成・デバッグを行うためのキューです。
- genomon_m.q
- Genomon 本体のジョブを実行するためのキューです。 1 ユーザあたりの上限が 2 です。
- genomon.q
- Genomon の解析ジョブを実行するためのキューです。
キュー名 | スロット数 | 実行時間の上限 | このキューでの実行方法の例[1] | 備考 | |||
---|---|---|---|---|---|---|---|
Shirokane5 | Shirokane6 | Shirokane7 | |||||
gc020-022 (EPYC) | rc001-032 (EPYC) | pc001-060 (EPYC) | pcl01-03 (EPYC) | ||||
mjobs.q + mjobs_rerun.q | - | 2,432 | 9,984 | - | 2 日 | qsub [] [2] | デフォルトのキュー。計算ノード Thin |
ljobs.q | - | 512 | 1,536 | - | 62 日 | qsub -l ljob [] | 計算ノード Thin |
lmem.q | - | - | - | 576 | 14 日 | qsub -l lmem [] | 計算ノード Fat |
intr.q | - | 384 | - | - | 無制限 | qlogin | 計算ノードにログインする。 |
web.q | - | 128 | - | - | 無制限 | qsub -q web.q [] | でのみ利用可能。 |
cp.q | - | 54 | - | - | 無制限 | qsub -l cp [] | データをコピーするために利用可能。 |
genomon_m.q | - | 12 | - | - | 14 日 | qsub -l genomon_master [] | Genomon 本体のジョブを実行する。 |
genomon.q | 108[3] | 128 | - | - | 14 日 | qsub -l genomon [] | Genomon のパイプライン設定ファイルに記述する。 |
キュー名 | スロット数 | 実行時間の上限 | このキューでの実行方法の例 | 備考 | |
---|---|---|---|---|---|
Shirokane6 | Shirokane7 | ||||
rca01-38 (ARM) | pca01-32 (ARM) | ||||
arm.q | 2,720 | 8,192 | 2 日 | qsub -l arm [] | 計算ノード Arm |
intra.q | 160 | - | 無制限 | qlogin -l arm | 計算ノード Arm にログインする。 |
キュー名 | スロット数 | 実行時間の上限 | このキューでの実行方法の例 | 備考 | ||
---|---|---|---|---|---|---|
Shirokane5 | Shirokane7 | |||||
gcg01-10 (V100) | gcga01 (A100) | pcg01-02 (H100) | ||||
gpuv.q | 432 | - | - | 7 日 | qsub -l v100=1 [] | GPU (Tesla V100) 搭載ノード。 |
gpua.q | - | 128 | - | 4 日 | qsub -l a100=1 [] | GPU (NVIDIA A100) 搭載ノード。 |
gpuh.q | - | - | 224 | 4 日 | qsub -l h100=1 [] | GPU (NVIDIA H100) 搭載ノード。 |
リアルタイムでのキューの設定と利用状況は qavail コマンドにより表示されます。
$ qavail -af
- ↑ 直接キューを選択することはマニア以外ありません。通常は、AGE のリソース の指定により間接的にキューを選択します。直接キューを選択すると気づかずに非効率になったり、実行開始されないジョブの解決に時間を使ってしまうことがよく起こります。キューの直接の指定は、注意をしていてもミスが起きることをご理解の上行ってください。
- ↑ qsub コマンドの引数の
-l
オプションによるリソースの要求にてキューを選択しない場合、ジョブは mjobs.q, ljob.q, mjobs_rerun.q, または (グループに存在すれば) 専有キュー のいずれかの空いているキュー、あるいはメモリ要求量によっては lmem.q で実行されます。 - ↑ genomon.q には Shirokane5 計算ノード Thin を一部使用しています。