Meilleures pratiques en matière de restauration du système - Service géré pour Apache Flink

Le service géré Amazon pour Apache Flink était auparavant connu sous le nom d’Amazon Kinesis Data Analytics pour Apache Flink.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Meilleures pratiques en matière de restauration du système

Grâce aux fonctionnalités de restauration automatique du système et de visibilité des opérations d'Amazon Managed Service pour Apache Flink, vous pouvez identifier et résoudre les problèmes liés à vos applications.

Annulations du système

Si l'opération de mise à jour ou de dimensionnement de votre application échoue en raison d'une erreur du client, telle qu'un bogue de code ou un problème d'autorisation, Amazon Managed Service pour Apache Flink tente automatiquement de revenir à la version en cours d'exécution précédente si vous avez opté pour cette fonctionnalité. Pour de plus amples informations, veuillez consulter Activez les annulations du système pour votre application Managed Service for Apache Flink. Si ce retour automatique échoue ou si vous ne vous êtes pas inscrit ou désabonné, votre demande sera enregistrée dans l'READYÉtat. Pour mettre à jour votre application, procédez comme suit :

Annulation manuelle

Si l'application ne progresse pas et reste dans un état transitoire pendant une longue période, ou si elle est passée avec succès, mais que vous rencontrez des problèmes en avalRunning, tels que des erreurs de traitement dans une application Flink mise à jour avec succès, vous pouvez la restaurer manuellement à l'aide du. RollbackApplication API

  1. Appel RollbackApplication : cela permettra de revenir à la version en cours d'exécution précédente et de restaurer l'état précédent.

  2. Surveillez l'opération de restauration à l'aide du DescribeApplicationOperationAPI.

  3. Si la restauration échoue, utilisez les étapes précédentes de restauration du système.

Visibilité des opérations

ListApplicationOperationsAPIAffiche l'historique de toutes les opérations du client et du système sur votre application.

  1. Obtenez le nom operationIdde l'opération qui a échoué dans la liste.

  2. Appelez DescribeApplicationOperation et vérifiez l'état et statusDescription.

  3. En cas d'échec d'une opération, la description indique une erreur potentielle à examiner.

Bogues courants liés aux codes d'erreur : utilisez les fonctionnalités de restauration pour revenir à la dernière version fonctionnelle. Corrigez les bogues et réessayez la mise à jour.

Problèmes d'autorisation : utilisez le DescribeApplicationOperation pour voir les autorisations requises. Mettez à jour les autorisations de l'application et réessayez.

Problèmes liés au service Amazon Managed Service for Apache Flink : consultez le dossier d'assistance AWS Health Dashboard ou ouvrez un dossier de support.