Log keluaran EC2 konsol Amazon - AWS ParallelCluster

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Log keluaran EC2 konsol Amazon

Saat AWS ParallelCluster mendeteksi bahwa instance node komputasi statis berakhir secara tidak terduga, instans tersebut mencoba mengambil output EC2 konsol Amazon dari instance node yang dihentikan setelah periode waktu berlalu. Dengan cara ini, jika node komputasi tidak dapat berkomunikasi dengan Amazon CloudWatch, informasi pemecahan masalah yang berguna tentang mengapa node dihentikan mungkin masih diambil dari output konsol. Output konsol ini direkam dalam /var/log/parallelcluster/compute_console_output log pada node kepala. Untuk informasi selengkapnya tentang keluaran EC2 konsol Amazon, lihat Output konsol instans di Panduan EC2 Pengguna Amazon untuk Instans Linux.

Secara default, AWS ParallelCluster hanya mengambil output konsol dari subset sampel node yang dihentikan. Ini mencegah node kepala cluster kewalahan dengan beberapa permintaan keluaran konsol yang disebabkan oleh sejumlah besar penghentian. Secara default, AWS ParallelCluster tunggu 5 menit antara deteksi terminasi dan pengambilan keluaran konsol untuk memberi Amazon EC2 waktu untuk mengambil output konsol akhir dari node.

Anda dapat mengedit ukuran sampel dan nilai parameter waktu tunggu dalam /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf file pada node kepala.

Fitur ini ditambahkan dalam AWS ParallelCluster versi 3.5.0.

Parameter keluaran EC2 konsol Amazon

Anda dapat mengedit nilai parameter keluaran EC2 konsol Amazon berikut dalam /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf file di node kepala.

compute_console_logging_enabled

Untuk menonaktifkan koleksi log keluaran konsol, setel compute_console_logging_enabled kefalse. Nilai default-nya true.

Anda dapat memperbarui parameter ini kapan saja, tanpa menghentikan armada komputasi.

compute_console_logging_max_sample_size

compute_console_logging_max_sample_sizemenetapkan jumlah maksimum node komputasi dari mana AWS ParallelCluster mengumpulkan output konsol setiap kali mendeteksi penghentian yang tidak terduga. Jika nilai ini kurang dari1, AWS ParallelCluster mengambil output konsol dari semua node yang dihentikan. Nilai default-nya adalah 1.

Anda dapat memperbarui parameter ini kapan saja, tanpa menghentikan armada komputasi.

compute_console_wait_time

compute_console_wait_timemengatur waktu, dalam detik, yang AWS ParallelCluster menunggu antara mendeteksi kegagalan node dan mengumpulkan output konsol dari node itu. Anda dapat meningkatkan waktu tunggu jika Anda menentukan bahwa Amazon EC2 membutuhkan lebih banyak waktu untuk mengumpulkan hasil akhir dari node yang dihentikan. Nilai default adalah 300 detik (5 menit).

Anda dapat memperbarui parameter ini kapan saja, tanpa menghentikan armada komputasi.