Logique de régulation du service Amazon ECS - Amazon Elastic Container Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Logique de régulation du service Amazon ECS

Le planificateur de service Amazon ECS inclut une logique de protection qui limite le lancement des tâches lorsque celles-ci échouent à plusieurs reprises. Cela permet d'éviter une consommation inutile de ressources et de réduire les coûts.

Lorsque les tâches d'un service ne passent pas d'un RUNNING état PENDING à un autre et passent directement à un état à un autreSTOPPED, le planificateur :

  • Augmente progressivement le délai entre les tentatives de redémarrage

  • Continue d'augmenter les délais jusqu'à un maximum de 27 minutes entre les tentatives

  • Génère un message d'événement de service pour vous informer du problème

Note

Le délai maximum de 27 minutes peut changer dans les futures mises à jour.

Lorsque la régulation est activée, vous recevez ce message d'événement de service :

(service service-name) is unable to consistently start tasks successfully.

Caractéristiques importantes de la logique de l'accélérateur :

  • Les services continuent de réessayer indéfiniment

  • La seule modification est l'augmentation du temps entre les redémarrages

  • Il n'existe aucun paramètre configurable par l'utilisateur

Résolution des problèmes de régulation

Pour résoudre le problème de l'étranglement, vous pouvez :

  • Mettez à jour le service pour utiliser une nouvelle définition de tâche, qui rétablit immédiatement le fonctionnement normal du service, sans limitation. Pour de plus amples informations, veuillez consulter Mettre à jour un service Amazon ECS.

  • Corrigez la cause sous-jacente des échecs des tâches.

Les causes courantes d'échec des tâches qui déclenchent la régulation sont les suivantes :

Important

Les scénarios suivants ne déclenchent PAS la logique d'accélération :

  • Tâches qui s'arrêtent après avoir atteint RUNNING l'état

  • Tâches arrêtées en raison de l'échec des tests de santé d'Elastic Load Balancing

  • Tâches pour lesquelles la commande du conteneur se termine avec un code différent de zéro après avoir atteint l'état RUNNING