Solução de problemas do Amazon ECS Anywhere - Amazon Elastic Container Service

Solução de problemas do Amazon ECS Anywhere

O Amazon ECS Anywhere fornece suporte para registrar uma instância externa, como um servidor on-premises ou uma máquina virtual (VM), no cluster do Amazon ECS. Veja a seguir os problemas comuns que você pode encontrar e as recomendações gerais para solução destes problemas.

Problemas de registro de instância externa

Ao registrar uma instância externa no cluster do Amazon ECS, os seguintes requisitos devem ser atendidos:

  • Uma ativação do AWS Systems Manager, que consiste em um ID de ativação e em um código de ativação, deve ser recuperada. Você a utiliza para registrar a instância externa como uma instância gerenciada do Systems Manager. Quando uma ativação do Systems Manager é solicitada, especifique um limite de registro e uma data de validade. O limite de registro especifica o número máximo de instâncias que podem ser registradas usando a ativação. O valor padrão do limite de registro é a instância 1. A data de validade especifica quando a validade da ativação. O valor padrão é 24 horas. Se a ativação do Systems Manager que você está usando para registrar a instância externa não estiver válida, solicite uma nova. Para ter mais informações, consulte Registro de uma instância externa para um cluster do Amazon ECS.

  • Uma política do IAM é usada para fornecer à instância externa as permissões necessárias para se comunicar com operações de API da AWS. Se essa política gerenciada não for criada corretamente e não contiver as permissões necessárias, o registro da instância externa apresentará falha. Para ter mais informações, consulte Perfil do IAM para o Amazon ECS Anywhere.

  • O Amazon ECS fornece um script de instalação que instala o Docker, o agente de contêiner do Amazon ECS e o Systems Manager Agent na instância externa. Se o script de instalação apresentar falha, é provável que ele não possa ser executado novamente na mesma instância sem a ocorrência de erro. Se isso acontecer, siga o processo de limpeza dos recursos da AWS da instância para que o script de instalação possa ser executado novamente. Para ter mais informações, consulte Cancelamento do registro de uma instância externa do Amazon ECS.

    nota

    Saiba que, se o script de instalação tiver solicitado e usado com êxito a ativação do Systems Manager, a execução, pela segunda vez, do script de instalação usará novamente a ativação do Systems Manager. Isso pode, por sua vez, fazer com que você atinja o limite de registro para essa ativação. Se esse limite for atingido, você deverá criar uma nova ativação.

  • Ao executar o script de instalação em uma instância externa para workloads de GPU, ocorrerá um erro se o driver NVIDIA não for detectado ou configurado corretamente. O script de instalação usa o comando nvidia-smi para confirmar a existência do driver NVIDIA.

Problemas de rede de instâncias externas

Para comunicar quaisquer alterações, a instância externa requer uma conexão de rede com a AWS. Se sua instância externa perder sua conexão de rede com a AWS, as tarefas que estão sendo executadas nas instâncias continuarão sendo executadas de qualquer maneira, a menos que sejam interrompidas manualmente. Após a restauração da conexão com a AWS, as credenciais da AWS usadas pelo agente de contêiner do Amazon ECS e pelo Systems Manager Agent na instância externa são renovadas automaticamente. Para obter mais informações sobre os domínios da AWS que são usados para comunicação entre a instância externa e a AWS, consulte Redes .

Problemas na execução de tarefas ne instância externa

Se as tarefas ou contêineres não forem executados na instância externa, as causas mais comuns serão relacionadas à rede ou à permissão. Se os contêineres estiverem extraindo imagens do Amazon ECR ou estiverem configurados para enviar logs de contêiner para o CloudWatch Logs, sua definição de tarefa deverá especificar uma função do IAM de execução de tarefa válida. Sem uma função do IAM de execução de tarefa válida, os contêineres apresentarão falha na inicialização. Para obter mais informações sobre problemas relacionados à rede, consulte Problemas de rede de instâncias externas.

Importante

O Amazon ECS fornece a ferramenta de coleta de logs do Amazon ECS. É possível usá-la para coletar logs das instâncias externas para fins de solução de problemas. Para ter mais informações, consulte Coleta de logs de contêiner com o coletor de logs do Amazon ECS .