AGE: Altair Grid Engine は Altair 社が開発を続けるグリッドコンピューティングシステムを構築するためのソフトウェアです。ジョブを管理するプログラムです。
AGE を利用することで、1 台のマシン上で実行していたプログラムを、複数の計算機で円滑に逐次実行することが可能となります。 SHIROKANE は、AGE による利用を前提として設計されたシステムであり、SHIROKANE のユーザは AGE を利用してジョブを実行します。
- バッチジョブ、およびインタラクティブジョブの実行が可能です
- ユーザがある 1 台の計算機からジョブを発行 (qsub) すると、AGE は負荷の少ない他の計算機にジョブを転送し実行します
- ジョブ発行時 (qsub コマンド実行時) に何も指定がなければ、実行結果はホームディレクトリに出力されます
詳細な使い方については、スパコン Wiki や講習会資料 (SHIROKANE 利⽤者⼊⾨講習会, 大規模にジョブを実行する際の心得) をご参照ください。
AGE を利用するメリットとは?
- ジョブを発行することで、多くのプログラムを同時に実行できます
- AGE が自動でスケジューリングを行うため大量のジョブを円滑に実行できます
- 1 つのプログラムに複数のパラメータを設定し実行する Array Job (アレイジョブ) 機能が利用できます
- GUI を利用したジョブの発行も可能です
AGE の仕組みから見る気をつけること
- AGE はジョブのプログラムを並列化して実行するわけではありません。システムにある計算ノードをモニタリングしつつ、 qsub されたジョブを適切な計算ノードで逐次実行するソフトウェアです
- ジョブが参照するファイルは、基本ではホームディレクトリ等の全ての計算ノードから共有して参照できるディレクトリに設置してください。
/tmp
、/ram
等の計算ノードのローカルディスクには、入力ファイル、中間ファイルを設置することは可能ですが、最終出力結果ファイルをホームディレクトリ等に回収することを忘れないでください。またローカルディスクにファイルを残したままにしないでください。ローカルディスクの利用については、一時ファイルを見てください - ジョブが使用する CPU コアの数をオプション
-pe
の def_slot 等により正しく UGE に要求する必要があります
強く関連するページ
その他の関連するページは Category:Grid Engine をご覧ください。
GE、OGS、SGE、 N1GE、 OGE、 UGE とは
HGC や他のスパコン Web サイト、AGE の資料や変数名などに、 AGE ではなく UGE 、OGE 、N1GE 、SGE や GE という表記があることがあります。これらはどれも過去のグリッドエンジンの名前です。基本的に現在の AGE と互換がありますので Web サイトと資料では、 AGE に読み替えてお読みください。変数名は SGE
のまま変えずにお読みください。
- GE (Grid Engine): 初期に提供されていたオープンソースのフリーソフトウエアです。 有志により開発・保守が行われている Open Grid Scheduler へ引き継がれます
- OGS (Open Grid Scheduler): 過去に提供されていたオープンソースのフリーソフトウエアです。GE 開発に関わっていた有志により開発・保守が行われていました
- SGE (Sun Grid Engine): Sun Microsystems 社が提供していた有償ソフトウェアです。後に N1GE と名称が変わります
- N1GE (N1 Grid Engine): Sun Microsystems 社が提供していた有償ソフトウェアです。後に Oracle 社 が Sun Microsystems 社を買収したことにより、 Oracle Grid Engine へ引き継がれます
- OGE (Oracle Grid Engine): Oracle 社が提供している有償ソフトウェアです
- UGE (Univa Grid Engine): N1GE 開発チームのメンバーが現在所属している Univa 社により、N1GE の機能を引き継いで提供されていた有償ソフトウェアです。後に Altair 社 が Univa 社 を買収したことにより、 Altair Grid Engine へ引き継がれます
- AGE (Altair Grid Engine): Altair 社により、UGE の機能を引き継いで提供されている有償ソフトウェアです