Melhores práticas de reversão do sistema - Managed Service for Apache Flink

Anteriormente, o Amazon Managed Service for Apache Flink era conhecido como Amazon Kinesis Data Analytics for Apache Flink.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Melhores práticas de reversão do sistema

Com recursos automáticos de reversão do sistema e visibilidade das operações no Amazon Managed Service para Apache Flink, você pode identificar e resolver problemas com seus aplicativos.

Reversões do sistema

Se a operação de atualização ou escalabilidade do seu aplicativo falhar devido a um erro do cliente, como um bug de código ou problema de permissão, o Amazon Managed Service para Apache Flink tentará automaticamente reverter para a versão em execução anterior se você tiver optado por essa funcionalidade. Para obter mais informações, consulte Habilite reversões do sistema para seu aplicativo Managed Service for Apache Flink. Se essa reversão automática falhar ou você não tiver optado por participar ou não, seu aplicativo será colocado no estado. READY Para atualizar seu aplicativo, conclua as seguintes etapas:

Reversão manual

Se o aplicativo não estiver progredindo e estiver em um estado transitório por muito tempo, ou se a transição do aplicativo for bem-sucedidaRunning, mas você observar problemas posteriores, como erros de processamento em um aplicativo Flink atualizado com êxito, você poderá revertê-lo manualmente usando o. RollbackApplication API

  1. Chamada RollbackApplication - isso reverterá para a versão anterior em execução e restaurará o estado anterior.

  2. Monitore a operação de reversão usando o. DescribeApplicationOperation API

  3. Se a reversão falhar, use as etapas anteriores de reversão do sistema.

Visibilidade das operações

ListApplicationOperationsAPIMostra o histórico de todas as operações do cliente e do sistema em seu aplicativo.

  1. Obtenha o operationIdda operação com falha na lista.

  2. Ligue DescribeApplicationOperation e verifique o status statusDescriptione.

  3. Se uma operação falhar, a descrição aponta para um possível erro a ser investigado.

Bugs comuns de código de erro: use os recursos de reversão para reverter para a última versão em funcionamento. Resolva os bugs e repita a atualização.

Problemas de permissão: use o DescribeApplicationOperation para ver as permissões necessárias. Atualize as permissões do aplicativo e tente novamente.

Amazon Managed Service para problemas com o serviço Apache Flink: verifique AWS Health Dashboard ou abra um caso de suporte.