翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon EC2 コンソール出力ログ
は、静的コンピューティングノードインスタンスが予期せず終了したこと AWS ParallelCluster を検出すると、一定期間が経過した後に、終了したノードインスタンスから Amazon EC2 コンソール出力を取得しようとします。これにより、コンピューティングノードが Amazon CloudWatch と通信できなかった場合でも、ノードが終了した理由に関する有用なトラブルシューティング情報をコンソール出力から取得できます。このコンソール出力はヘッドノードの /var/log/parallelcluster/compute_console_output
ログに記録されます。Amazon EC2 コンソール出力の詳細については、「Linux インスタンス用 Amazon EC2 ユーザーガイド」の「インスタンスコンソール出力」を参照してください。
デフォルトでは、 は終了したノードのサンプルサブセットから AWS ParallelCluster のみコンソール出力を取得します。これにより、多数の終了による複数のコンソール出力要求でクラスターヘッドノードが圧倒されるのを防ぐことができます。デフォルトでは、 は終了検出からコンソール出力の取得まで 5 分 AWS ParallelCluster 待機し、Amazon EC2 にノードから最終的なコンソール出力を取得する時間を与えます。
ヘッドノード上の /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf
ファイルで、サンプルサイズと待機時間のパラメータ値を編集できます。
この機能は AWS ParallelCluster バージョン 3.5.0 で追加されています。
Amazon EC2 コンソール出力パラメータ
ヘッドノードの /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf
ファイルで、以下の EC2 コンソール出力パラメータの値を編集できます。
compute_console_logging_enabled
コンソール出力ログの収集を無効にするには、compute_console_logging_enabled
を false
に設定します。デフォルトは true
です。
このパラメータは、コンピューティングフリートを停止せずにいつでも更新することができます。
compute_console_logging_max_sample_size
compute_console_logging_max_sample_size
は、予期しない終了を検出するたびに がコンソール出力を AWS ParallelCluster 収集するコンピューティングノードの最大数を設定します。この値が より小さい場合1
、 は終了したすべてのノードからコンソール出力 AWS ParallelCluster を取得します。デフォルト値は 1
です。
このパラメータは、コンピューティングフリートを停止せずにいつでも更新することができます。
compute_console_wait_time
compute_console_wait_time
は、ノード障害を検出してからそのノードからコンソール出力を収集するまで AWS ParallelCluster 待機する時間を秒単位で設定します。終了したノードから最終出力を収集するためにより多くの時間が Amazon EC2 に必要だと判断した場合は、待機時間を増やすことができます。デフォルト値は 300 秒 (5 分) です。
このパラメータは、コンピューティングフリートを停止せずにいつでも更新することができます。