SHIROKANE の AGE には、用途に応じて下記のキューが用意されています。ユーザがキューを直接選択することは web.q 以外になく、もっぱら リソースにより間接的にキューを選択します。

ljobs.q
計算ノード Thin に作られた、実行時間の上限が 62 日のキューです。計算に長時間かかるジョブのためにあります。
mjobs.q、mjobs_rerun.q
デフォルトの、計算ノード Thin に作られた、実行時間の上限が 2 日のキューです。
intr.q
インタラクティブキュー対話式ジョブの実行やバッチジョブの作成・デバッグのためにあります。計算ノード Thin に作られています。無操作状態が 6 時間続くと自動でログアウトされます。
lmem.q
計算ノード Fat に作られた、実行時間の上限が 14 日のキューです。
web.q
Web サービスで使用するキューです。
cp.q
データをコピーするためのキューです。qrecall でも使用されるキューです。cp、rsync 等データコピーのみのジョブスクリプトを実行する場合に限り利用できます。 1 ユーザあたりの上限が 2 です。パラレルエンヴァイロメントを要求するジョブは実行できません。
gpuv.q
Tesla V100 (GPU) 搭載ノードを使用するキューです。 Tesla V100 (GPU) の使い方
gpua.q
NVIDIA A100 (GPU) 搭載ノードを使用するキューです。 NVIDIA A100 (GPU) の使い方
専有キュー
キューの名前は、groupname.q です。計算ノード Thin に作られたキューです。実行時間に制限はありません。利用コースによって割当量が違い、割当がないコースもあります。グループの利用者が専有して利用できるキューです。
arm.q
Arm アーキテクチャ の CPU を搭載した 計算ノード Arm を使用するキューです。
intra.q
計算ノード Armインタラクティブキュー。Arm アーキテクチャの CPU を搭載したノードで対話式ジョブの実行やバッチジョブの作成・デバッグを行うためのキューです。
キュー名 スロット数 実行時間の上限このキューでの実行方法の例[1] 備考
Shirokane5 Shirokane6
gc001-346
(Xeon)
gcl01-02
(Xeon)
gcg01-10
(Tesla)
gcga01
(A100)
rc001-032
(EPYC)
rca01-38
(arm)
mjobs.q + mjobs_rerun.q 11,556 - - - 1,792 - 2 日 qsub [ジョブスクリプト] [2] デフォルトキュー計算ノード Thin
ljobs.q 72 - - - 2,176 - 62 日 qsub -l ljob [ジョブスクリプト] Shirokane3 以降の ljobs.q は実行時間の上限が 62 日。
lmem.q - 144 - - - - 14 日 qsub -l lmem [ジョブスクリプト] 計算ノード Fat
intr.q 288 - - - - - 無制限 qlogin 計算ノードログインする。
web.q 36 - - - - - 無制限 qsub -q web.q [ジョブスクリプト] でのみ利用可能。
cp.q 54 - - - - - 無制限 qsub -l cp [ジョブスクリプト] データをコピーするために利用可能。
gpuv.q - - 288 - - - 7 日 qsub -l v100=1 [ジョブスクリプト] GPU (Tesla V100) 搭載ノード。
gpua.q - - - 128 - - 4 日 qsub -l a100=1 [ジョブスクリプト] GPU (NVIDIA A100) 搭載ノード。
arm.q - - - - - 2,720 2 日 qsub -l arm [ジョブスクリプト] Arm アーキテクチャ CPU 搭載ノード。
intra.q - - - - - 160 無制限 qlogin -l arm 計算ノード Armログインする。

リアルタイムでのキューの設定と利用状況は qavail コマンドにより表示されます。

$ qavail -af

  1. 直接キューを選択することはマニア以外ありません。通常は、AGE のリソース の指定により間接的にキューを選択します。直接キューを選択すると気づかずに非効率になったり、実行開始されないジョブの解決に時間を使ってしまうことがよく起こります。キューの直接の指定は、注意をしていてもミスが起きることをご理解の上行ってください。
  2. qsub コマンド引数-l オプションによるリソースの要求にてキューを選択しない場合、ジョブは mjobs.q, ljob.q, mjobs_rerun.q, または (グループに存在すれば) 専有キュー のいずれかの空いているキュー、あるいはメモリ要求量によっては lmem.q で実行されます。