Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Log keluaran EC2 konsol Amazon
Saat AWS ParallelCluster mendeteksi bahwa instance node komputasi statis berakhir secara tidak terduga, instans tersebut mencoba mengambil output EC2 konsol Amazon dari instance node yang dihentikan setelah periode waktu berlalu. Dengan cara ini, jika node komputasi tidak dapat berkomunikasi dengan Amazon CloudWatch, informasi pemecahan masalah yang berguna tentang mengapa node dihentikan mungkin masih diambil dari output konsol. Output konsol ini direkam dalam /var/log/parallelcluster/compute_console_output
log pada node kepala. Untuk informasi selengkapnya tentang keluaran EC2 konsol Amazon, lihat Output konsol instans di Panduan EC2 Pengguna Amazon untuk Instans Linux.
Secara default, AWS ParallelCluster hanya mengambil output konsol dari subset sampel node yang dihentikan. Ini mencegah node kepala cluster kewalahan dengan beberapa permintaan keluaran konsol yang disebabkan oleh sejumlah besar penghentian. Secara default, AWS ParallelCluster tunggu 5 menit antara deteksi terminasi dan pengambilan keluaran konsol untuk memberi Amazon EC2 waktu untuk mengambil output konsol akhir dari node.
Anda dapat mengedit ukuran sampel dan nilai parameter waktu tunggu dalam /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf
file pada node kepala.
Fitur ini ditambahkan dalam AWS ParallelCluster versi 3.5.0.
Parameter keluaran EC2 konsol Amazon
Anda dapat mengedit nilai parameter keluaran EC2 konsol Amazon berikut dalam /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf
file di node kepala.
compute_console_logging_enabled
Untuk menonaktifkan koleksi log keluaran konsol, setel compute_console_logging_enabled
kefalse
. Nilai default-nya true
.
Anda dapat memperbarui parameter ini kapan saja, tanpa menghentikan armada komputasi.
compute_console_logging_max_sample_size
compute_console_logging_max_sample_size
menetapkan jumlah maksimum node komputasi dari mana AWS ParallelCluster mengumpulkan output konsol setiap kali mendeteksi penghentian yang tidak terduga. Jika nilai ini kurang dari1
, AWS ParallelCluster mengambil output konsol dari semua node yang dihentikan. Nilai default-nya adalah 1
.
Anda dapat memperbarui parameter ini kapan saja, tanpa menghentikan armada komputasi.
compute_console_wait_time
compute_console_wait_time
mengatur waktu, dalam detik, yang AWS ParallelCluster menunggu antara mendeteksi kegagalan node dan mengumpulkan output konsol dari node itu. Anda dapat meningkatkan waktu tunggu jika Anda menentukan bahwa Amazon EC2 membutuhkan lebih banyak waktu untuk mengumpulkan hasil akhir dari node yang dihentikan. Nilai default adalah 300 detik (5 menit).
Anda dapat memperbarui parameter ini kapan saja, tanpa menghentikan armada komputasi.