Solución de problemas cuando se agota el tiempo de espera de una actualización del clúster cuando no se está ejecutando cfn-hup - AWS ParallelCluster

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solución de problemas cuando se agota el tiempo de espera de una actualización del clúster cuando no se está ejecutando cfn-hup

El script auxiliar cfn-hup es un daemon que detecta cambios en los metadatos de recursos y ejecuta acciones especificadas por el usuario cuando se detecta un cambio. Esto le permite llevar a cabo actualizaciones de la configuración en las instancias de Amazon EC2 que se están ejecutando a través de la acción de la API UpdateStack.

Actualmente, el cfn-hup daemon lo lanza el. supervisord Pero después del lanzamiento, el cfn-hup proceso se separa del supervisord control. Si un actor externo acaba con el daemon de cfn-hup, no se reinicia automáticamente. Si cfn-hup no se está ejecutando, durante una actualización del clúster, la CloudFormation pila inicia el proceso de actualización según lo previsto, pero el procedimiento de actualización no se activa en el nodo principal y, finalmente, se agota el tiempo de espera de la pila. En los registros del clúster/var/log/chef-client, puede ver que la receta de actualización nunca se invoca.

Compruébelo y reinícielo cfn-hup en caso de errores

  1. En el nodo principal, compruebe si cfn-hup se está ejecutando:

    $ ps aux | grep cfn-hup
  2. Compruebe el cfn-hup registro /var/log/cfn-hup.log y /var/log/supervisord.log el nodo principal.

  3. Si cfn-hup no se está ejecutando, intenta reiniciarlo ejecutando:

    $ sudo /opt/parallelcluster/pyenv/versions/cookbook_virtualenv/bin/supervisorctl start cfn-hup