Activez les annulations du système pour votre application Managed Service for Apache Flink - Service géré pour Apache Flink

Le service géré Amazon pour Apache Flink était auparavant connu sous le nom d’Amazon Kinesis Data Analytics pour Apache Flink.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Activez les annulations du système pour votre application Managed Service for Apache Flink

Grâce à la fonctionnalité de restauration du système, vous pouvez améliorer la disponibilité de votre application Apache Flink en cours d'exécution sur Amazon Managed Service pour Apache Flink. Le fait d'opter pour cette configuration permet au service de rétablir automatiquement la version précédente de l'application lorsqu'une action, telle que des bogues de code UpdateApplication ou de configuration, autoscaling rencontre des bogues.

Note

Pour utiliser la fonction de restauration du système, vous devez vous y inscrire en mettant à jour votre application. Les applications existantes n'utiliseront pas automatiquement la restauration du système par défaut.

Comment ça marche

Lorsque vous lancez une opération d'application, telle qu'une action de mise à jour ou de dimensionnement, Amazon Managed Service pour Apache Flink tente d'abord d'exécuter cette opération. S'il détecte des problèmes empêchant le succès de l'opération, tels que des bogues de code ou des autorisations insuffisantes, le service lance automatiquement une RollbackApplication opération.

L'annulation tente de restaurer la version précédente de l'application qui s'est exécutée avec succès, ainsi que l'état de l'application associé. Si la restauration est réussie, votre application continue de traiter les données avec un temps d'arrêt minimal en utilisant la version précédente. Si la restauration automatique échoue également, Amazon Managed Service pour Apache Flink fait passer l'application au READY statut, afin que vous puissiez prendre d'autres mesures, notamment corriger l'erreur et réessayer l'opération.

Vous devez choisir d'utiliser les annulations automatiques du système. Vous pouvez l'activer à l'aide de la console ou API pour toutes les opérations sur votre application à partir de maintenant.

L'exemple de demande UpdateApplication d'action suivant permet d'annuler le système pour une application :

{ "ApplicationName": "MyApplication", "CurrentApplicationVersionId": 1, "ApplicationConfigurationUpdate": { "ApplicationSystemRollbackConfigurationUpdate": { "RollbackEnabledUpdate": "true" } } }

Passez en revue les scénarios courants de restauration automatique du système

Les scénarios suivants illustrent les avantages des annulations automatiques du système :

  • Mises à jour de l'application : si vous mettez à jour votre application avec un nouveau code comportant des bogues lors de l'initialisation de la tâche Flink par le biais de la méthode principale, le rollback automatique permet de restaurer la version fonctionnelle précédente. Parmi les autres scénarios de mise à jour dans lesquels les annulations du système sont utiles, citons :

    • Si votre application est mise à jour pour fonctionner avec un parallélisme supérieur à. maxParallelism

    • Si votre application est mise à jour pour s'exécuter avec des sous-réseaux incorrects, cela entraîne un échec lors du démarrage de la tâche Flink. VPC

  • Mises à niveau de la version de Flink : lorsque vous effectuez une mise à niveau vers une nouvelle version d'Apache Flink et que l'application mise à niveau rencontre un problème de compatibilité avec les snapshots, la restauration du système vous permet de revenir automatiquement à la version précédente de Flink.

  • AutoScaling: Lorsque l'application prend de l'ampleur mais rencontre des problèmes lors de la restauration à partir d'un point de sauvegarde, en raison d'un décalage entre l'opérateur et le graphe de tâches Flink.

Utiliser l'opération APIs pour les annulations du système

Pour offrir une meilleure visibilité, Amazon Managed Service pour Apache Flink propose deux services APIs liés aux opérations des applications qui peuvent vous aider à suivre les défaillances et les annulations de système associées.

ListApplicationOperations

Cela API répertorie toutes les opérations effectuées sur l'application, y comprisUpdateApplication,Maintenance, et les autresRollbackApplication, dans l'ordre chronologique inverse. L'exemple de demande d'ListApplicationOperationsaction suivant répertorie les 10 premières opérations de l'application :

{ "ApplicationName": "MyApplication", "Limit": 10 }

L'exemple de demande d'ListApplicationOperationsaide suivant permet de filtrer la liste en fonction des mises à jour précédentes de l'application :

{ "ApplicationName": "MyApplication", "operation": "UpdateApplication" }

DescribeApplicationOperation

Cela API fournit des informations détaillées sur une opération spécifique répertoriée parListApplicationOperations, y compris la raison de l'échec, le cas échéant. L'exemple de demande DescribeApplicationOperation d'action suivant répertorie les détails d'une opération d'application spécifique :

{ "ApplicationName": "MyApplication", "OperationId": "xyzoperation" }

Pour plus d’informations sur le dépannage, consultez Meilleures pratiques en matière de restauration du système.