Amazon EC2 コンソール出力ログ - AWS ParallelCluster

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon EC2 コンソール出力ログ

は、静的コンピューティングノードインスタンスが予期せず終了したこと AWS ParallelCluster を検出すると、一定期間が経過した後に、終了したノードインスタンスから Amazon EC2 コンソール出力を取得しようとします。これにより、コンピューティングノードが Amazon CloudWatch と通信できなかった場合でも、ノードが終了した理由に関する有用なトラブルシューティング情報をコンソール出力から取得できます。このコンソール出力はヘッドノードの /var/log/parallelcluster/compute_console_output ログに記録されます。Amazon EC2 コンソール出力の詳細については、「Linux インスタンス用 Amazon EC2 ユーザーガイド」の「インスタンスコンソール出力」を参照してください。

デフォルトでは、 は終了したノードのサンプルサブセットから AWS ParallelCluster のみコンソール出力を取得します。これにより、多数の終了による複数のコンソール出力要求でクラスターヘッドノードが圧倒されるのを防ぐことができます。デフォルトでは、 は終了検出からコンソール出力の取得まで 5 分 AWS ParallelCluster 待機し、Amazon EC2 にノードから最終的なコンソール出力を取得する時間を与えます。

ヘッドノード上の /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf ファイルで、サンプルサイズと待機時間のパラメータ値を編集できます。

この機能は AWS ParallelCluster バージョン 3.5.0 で追加されています。

Amazon EC2 コンソール出力パラメータ

ヘッドノードの /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf ファイルで、以下の EC2 コンソール出力パラメータの値を編集できます。

compute_console_logging_enabled

コンソール出力ログの収集を無効にするには、compute_console_logging_enabledfalse に設定します。デフォルトは true です。

このパラメータは、コンピューティングフリートを停止せずにいつでも更新することができます。

compute_console_logging_max_sample_size

compute_console_logging_max_sample_size は、予期しない終了を検出するたびに がコンソール出力を AWS ParallelCluster 収集するコンピューティングノードの最大数を設定します。この値が より小さい場合1、 は終了したすべてのノードからコンソール出力 AWS ParallelCluster を取得します。デフォルト値は 1 です。

このパラメータは、コンピューティングフリートを停止せずにいつでも更新することができます。

compute_console_wait_time

compute_console_wait_time は、ノード障害を検出してからそのノードからコンソール出力を収集するまで AWS ParallelCluster 待機する時間を秒単位で設定します。終了したノードから最終出力を収集するためにより多くの時間が Amazon EC2 に必要だと判断した場合は、待機時間を増やすことができます。デフォルト値は 300 秒 (5 分) です。

このパラメータは、コンピューティングフリートを停止せずにいつでも更新することができます。