Lógica de controle de utilização de serviço - Amazon Elastic Container Service

Lógica de controle de utilização de serviço

O programador de serviço do Amazon ECS inclui uma lógica que controla a frequência com que as tarefas de serviço são iniciadas caso apresentem falhas repetidas na inicialização.

Se as tarefas de um serviço do ECS falharem repetidamente ao tentar entrar no estado RUNNING (mudando diretamente do estado PENDING para STOPPED), o tempo entre as tentativas subsequentes aumentará incrementalmente até chegar, no máximo, a 15 minutos. Esse período máximo está sujeito a alterações no futuro e não deve ser considerado permanente. Esse comportamento reduz o efeito que as tarefas que não podem ser iniciadas têm sobre os custos dos recursos de cluster do Amazon ECS ou da infraestrutura do Fargate. Se o seu serviço acionar a lógica de controle, você receberá a seguinte mensagem de evento do serviço:

(service service-name) is unable to consistently start tasks successfully.

O Amazon ECS nunca impede novas tentativas de um serviço com falha nem tenta modificá-lo de outra forma que não seja aumentando o tempo entre as reinicializações. A lógica de controle de serviço não fornece parâmetros ajustáveis pelo usuário.

Se você atualizar o serviço para usar uma nova definição de tarefa, ele retornará imediatamente ao estado normal, não controlado. Para obter mais informações, consulte . Atualizar um serviço.

Veja a seguir algumas causas comuns que acionam essa lógica:

Importante

Tarefas que são interrompidas depois que alcançam o estado RUNNING não acionam a lógica de controle ou a mensagem de evento do serviço associada. Por exemplo, se as verificações de integridade do Elastic Load Balancing que apresentam falha em um serviço resultam na sinalização da tarefa como não íntegra e no cancelamento do registro e na eliminação da tarefa pelo Amazon ECS, isso não aciona o controle de utilização. Mesmo que um comando de contêiner da tarefa seja encerrado imediatamente com um código de saída diferente de zero, o estado da tarefa já terá sido mudado para RUNNING. Tarefas que falham imediatamente devido a erros de comando não acionam o controle ou a mensagem de evento do serviço.