SHIROKANE の UGE には、用途に応じて下記のキューが用意されています。ユーザがキューを直接選択することは web.q 以外になく、もっぱら リソースにより間接的にキューを選択します。

ljobs.q
計算ノード Thin に作られた、実行時間の上限が 62 日のキューです。計算に長時間かかるジョブのためにあります。
mjobs.q、mjobs_rerun.q
デフォルトの、計算ノード Thin に作られた、実行時間の上限が 2 日のキューです。
intr.q
インタラクティブキュー対話式ジョブの実行やバッチジョブの作成・デバッグのためにあります。計算ノード Thin に作られています。無操作状態が 6 時間続くと自動でログアウトされます。
lmem.q
計算ノード Fat に作られた、実行時間の上限が 14 日のキューです。
web.q
Web サービスで使用するキューです。
cp.q
データをコピーするためのキューです。qrecall を行うとデフォルトで使用されるキューです。cp、rsync 等データコピーのみのジョブスクリプトを実行する場合に限り利用できます。
knl.q
Xeon Phi 7210 搭載ノードを使用するキューです。Xeon Phi 7210 の使い方
gpu.q
Tesla K80 (GPU) 搭載ノードを使用するキューです。 Tesla K80 (GPU) の使い方
gpuv.q
Tesla V100 (GPU) 搭載ノードを使用するキューです。 Tesla V100 (GPU) の使い方
専有キュー
キューの名前は、groupname.q です。計算ノード Thin に作られたキューです。実行時間に制限はありません。利用コースによって割当量が違い、割当がないコースもあります。グループの利用者が専有して利用できるキューです。
キュー名 スロット数 実行時間の上限このキューでの実行方法の例[1] 備考
Shirokane4 Shirokane5
yc001-138
(Xeon)
yck01-02
(Xeon)
gc001-346
(Xeon)
gcl01-02
(Xeon)
gcg01-10
(Tesla)
mjobs.q + mjobs_rerun.q 2376 - 10224 - - 2 日 qsub [ジョブスクリプト] [2] デフォルトキュー計算ノード Thin
ljobs.q 456 - 1584 - - 62 日 qsub -l ljob [ジョブスクリプト] Shirokane3 以降の ljobs.q は実行時間の上限が 62 日。
lmem.q - - - 144 - 14 日 qsub -l lmem [ジョブスクリプト] 計算ノード Fat
intr.q 192 - 288 - - 無制限 qlogin 計算ノードログインする。
web.q - - 36 - - 無制限 qsub -q web.q [ジョブスクリプト] でのみ利用可能。
cp.q 96 - - - - 無制限 qsub -l cp [ジョブスクリプト] データをコピーするために利用可能。
knl.q - 128 - - - 2 日 qsub -l knl [ジョブスクリプト] Xeon Phi 7210 搭載ノード。
gpu.q 8 - - - - 10 日 qsub -l gpu [ジョブスクリプト] GPU (Tesla K80) 搭載ノード。
gpuv.q - - - - 240 2 日 qsub -l v100=1 [ジョブスクリプト] GPU (Tesla V100) 搭載ノード。

リアルタイムでのキューの設定と利用状況は qavail コマンドにより表示されます。

$ qavail -af

  1. 直接キューを選択することはマニア以外ありません。通常は、UGE のリソース の指定により間接的にキューを選択します。直接キューを選択すると気づかずに非効率になったり、実行開始されないジョブの解決に時間を使ってしまうことがよく起こります。キューの指定は、注意してもミスを防げないことを記しておきます。
  2. qsub コマンド引数-l オプションによるリソースの要求にてキューを選択しない場合、ジョブは mjobs.q, ljob.q, mjobs_rerun.q, または (グループに存在すれば) 専有キュー のいずれかの空いているキューで実行されます。