翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
AWS PCS クラスターで Slurm CLI フィルタープラグインを設定する
新しい PCS クラスターを作成するときに CLI AWS フィルタープラグインを設定します。クラスターを再作成せずに、Update API またはコンソールを使用して、既存のクラスターで CLI フィルタープラグインを有効または無効にできます。
前提条件
CLI フィルタープラグインを設定する前に、以下のタスクを完了してください。
-
CLI Filter Plugin API を実装する Lua スクリプトを記述してテストする
-
Lua スクリプトに正確に名前を付ける
cli_filter.lua -
スクリプトをすべてのクラスターインスタンス (AMI、S3、またはファイルシステム) にデプロイする方法を選択します。
-
Slurm バージョン 24.11 以降を使用していることを確認します。
新しいクラスターで CLI フィルタープラグインを有効にする
CLI フィルタープラグインスクリプトをデプロイする
CLI フィルタープラグインスクリプトをクラスターにデプロイするには
-
コンピューティングノードグループで使用されるすべての AMIs に、PCS Slurm インストーラを介して AWS Slurm がインストールされていることを確認します。
注記
すべてのコンピューティングノードグループに AWS PCS サンプル AMI を使用する場合は、このステップをスキップします。Slurm は既にインストールされています。
-
クラスター内のすべてのインスタンス
/etc/aws/pcs/scheduler/slurm-<version>/cli_filter.luaにcli_filter.luaスクリプトを にデプロイします。たとえば、Slurm バージョン 24.11 の場合:
/etc/aws/pcs/scheduler/slurm-24.11/cli_filter.lua -
準備AMIs を使用して、すべてのログインノードとコンピューティングノードを起動します。
-
ジョブの送信をテストして、CLI フィルタープラグインが正しく実行されることを確認します。
既存のクラスターで CLI フィルタープラグインを有効または無効にする
インフラストラクチャを再構築することなく、既存のクラスターで CLI フィルタープラグインを有効または無効にできます。詳細については、「PCS AWS でのクラスターの更新」を参照してください。
予想される結果
設定が完了したら、次の操作を行います。
-
クラスターは CLI フィルタープラグインを有効にして作成されます
-
ジョブの送信により、Slurm コントローラーに到達する前にカスタム検証ロジックがトリガーされます。
-
非準拠ジョブはカスタムエラーメッセージで拒否されます
-
準拠ジョブは Slurm スケジューラを介して正常に進行します。
トラブルシューティング
- CLI フィルタプラグインスクリプトがノードにありません
-
症状: プラグインのロードエラーにより、ジョブの送信がすぐに失敗します。
考えられる原因: スクリプトがすべてのインスタンスにデプロイされていないか、ファイルパスまたは名前が正しくありません。
解決策: スクリプトが、正確なファイル名 を持つすべてのログインノードとコンピューティングノードに正しいパスに存在することを確認します
cli_filter.lua。 - 無効な CLI フィルタープラグイン設定
-
症状: クラスターの作成が検証エラーで失敗します。
考えられる原因:
CliFilterPluginsパラメータがcli_filter/lua形式に設定されていません。解決策:
cli_filter/luaで正確なパラメータ値を使用しますslurmCustomSettings。