cfn-hup が実行していない場合のクラスター更新タイムアウトのトラブルシューティング - AWS ParallelCluster

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

cfn-hup が実行していない場合のクラスター更新タイムアウトのトラブルシューティング

cfn-hup ヘルパーは、リソースメタデータの変更を検出し、変更が検出された場合に、ユーザーが指定した操作を実行するデーモンです。これは、UpdateStack API アクションを介して、実行中の Amazon EC2 インスタンスで構成を更新する方法です。

現在、cfn-hup デーモンは supervisord によって起動されます。しかし、起動の後、cfn-hup プロセスは supervisord のコントロールからデタッチされます。cfn-hup デーモンが外部攻撃者により強制終了される場合、自動的に再開されることはありません。cfn-hup が実行されていない場合、クラスターの更新中、 CloudFormation スタックは予期したとおりに更新プロセスを開始しますが、ヘッドノードで更新手順がアクティブ化されず、スタックは最終的にタイムアウトになります。クラスターログ /var/log/chef-client から、更新レシピが呼び出されていないことを確認できます。

失敗した場合、cfn-hup を確認して再起動します

  1. ヘッドノードで、cfn-hup が実行されているかどうかを確認します。

    $ ps aux | grep cfn-hup
  2. ヘッドノードで cfn-hup ログ /var/log/cfn-hup.log/var/log/supervisord.log を確認してください。

  3. cfn-hup が実行されていない場合、次を実行して再起動してみます。

    $ sudo /opt/parallelcluster/pyenv/versions/cookbook_virtualenv/bin/supervisorctl start cfn-hup