Memecahkan masalah batas waktu pembaruan klaster saat cfn-hup tidak berjalan - AWS ParallelCluster

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memecahkan masalah batas waktu pembaruan klaster saat cfn-hup tidak berjalan

cfn-hupHelper adalah daemon yang mendeteksi perubahan dalam metadata sumber daya dan menjalankan tindakan yang ditentukan pengguna saat perubahan terdeteksi. Ini adalah cara Anda membuat pembaruan konfigurasi pada instans Amazon EC2 yang sedang berjalan melalui tindakan API. UpdateStack

Saat ini cfn-hup daemon diluncurkan oleh. supervisord Tetapi setelah peluncuran, cfn-hup prosesnya terlepas dari supervisord kontrol. Jika cfn-hup iblis dibunuh oleh aktor eksternal, itu tidak dimulai ulang secara otomatis. Jika cfn-hup tidak berjalan, selama pembaruan cluster, CloudFormation tumpukan memulai proses pembaruan seperti yang diharapkan tetapi prosedur pembaruan tidak diaktifkan pada node kepala dan tumpukan akhirnya masuk ke batas waktu. Dari log cluster/var/log/chef-client, Anda dapat melihat bahwa resep pembaruan tidak pernah dipanggil.

Periksa dan mulai ulang cfn-hup jika terjadi kegagalan

  1. Pada node kepala, periksa apakah cfn-hup sedang berjalan:

    $ ps aux | grep cfn-hup
  2. Periksa cfn-hup log /var/log/cfn-hup.log dan /var/log/supervisord.log pada node kepala.

  3. Jika cfn-hup tidak berjalan, coba mulai ulang dengan menjalankan:

    $ sudo /opt/parallelcluster/pyenv/versions/cookbook_virtualenv/bin/supervisorctl start cfn-hup