Solução de problemas de tempo limite de atualização de cluster quando cfn-hup não está em execução - AWS ParallelCluster

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Solução de problemas de tempo limite de atualização de cluster quando cfn-hup não está em execução

O auxiliar cfn-hup é um daemon que detecta alterações em metadados de recursos e executa ações especificadas pelo usuário quando uma alteração é detectada. É assim que você faz as atualizações de configuração em suas instâncias do Amazon EC2 em execução pela ação do API UpdateStack.

Atualmente, o daemon cfn-hup é lançado pelo supervisord. Mas após o lançamento, o processo cfn-hup é separado do controle supervisord. Se o daemon cfn-hup for encerrado por uma causa externa, ele não será reiniciado automaticamente. Se cfn-hup não estiver em execução, durante uma atualização do cluster, a CloudFormation pilha inicia o processo de atualização conforme o esperado, mas o procedimento de atualização não é ativado no nó principal e a pilha acaba atingindo o tempo limite. Nos logs do cluster /var/log/chef-client, você pode ver que a fórmula de atualização nunca é invocada.

Verifique e reinicie cfn-hup em caso de falhas

  1. No nó principal, verifique se cfn-hup está em execução:

    $ ps aux | grep cfn-hup
  2. Verifique o log cfn-hup /var/log/cfn-hup.log e /var/log/supervisord.log no nó principal.

  3. Se cfn-hup não estiver em execução, tente reiniciá-lo executando:

    $ sudo /opt/parallelcluster/pyenv/versions/cookbook_virtualenv/bin/supervisorctl start cfn-hup