Resiliência no Amazon Managed Service for Apache Flink - Managed Service for Apache Flink

Anteriormente, o Amazon Managed Service for Apache Flink era conhecido como Amazon Kinesis Data Analytics for Apache Flink.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Resiliência no Amazon Managed Service for Apache Flink

A infraestrutura AWS global é construída em torno de AWS regiões e zonas de disponibilidade. AWS As regiões fornecem várias zonas de disponibilidade fisicamente separadas e isoladas, conectadas a redes de baixa latência, alta taxa de transferência e alta redundância. Com as Zonas de Disponibilidade, é possível projetar e operar aplicações e bancos de dados que executem o failover automaticamente entre as Zonas de Disponibilidade sem interrupção. As zonas de disponibilidade são mais altamente disponíveis, tolerantes a falhas e escaláveis que uma ou várias infraestruturas de datacenter tradicionais.

Para obter mais informações sobre AWS regiões e zonas de disponibilidade, consulte Infraestrutura AWS global.

Além da infraestrutura AWS global, um serviço gerenciado para o Apache Flink oferece vários recursos para ajudar a suportar suas necessidades de resiliência e backup de dados.

Recuperação de desastres

O Managed Service for Apache Flink é executado em um modo sem servidor e cuida das degradações do host, da disponibilidade da zona de disponibilidade e outros problemas relacionados à infraestrutura, fazendo uma migração automática. O Managed Service for Apache Flink consegue isso por meio de vários mecanismos redundantes. Cada aplicativo Managed Service for Apache Flink é executado em um cluster do Apache Flink com locatário único. O cluster Apache Flink é executado no modo de alta disponibilidade usando o Zookeeper JobMananger em várias zonas de disponibilidade. O Managed Service for Apache Flink implanta o Apache Flink usando a Amazon. EKS Vários pods do Kubernetes são usados na Amazon EKS para cada AWS região em todas as zonas de disponibilidade. No caso de uma falha, o Managed Service for Apache Flink tenta em primeiro lugar recuperar o aplicativo dentro do cluster do Apache Flink em execução usando os pontos de verificação do seu aplicativo, se disponível.

O Managed Service for Apache Flink faz backup do estado do aplicativo usando pontos de verificação e snapshots:

  • Os pontos de verificação são backups do estado do aplicativo que o Managed Service for Apache Flink cria automaticamente e periodicamente e para restaurar falhas.

  • Os Snapshots são backups do estado do aplicativo que você cria e restaura manualmente.

Para obter mais informações sobre os pontos de verificação e os snapshots, consulte Implemente a tolerância a falhas no Managed Service for Apache Flink.

Versionamento

As versões armazenadas do estado do aplicativo são versionadas da seguinte forma:

  • Os pontos de verificação são versionados automaticamente pelo serviço. Se o serviço usar um ponto de verificação para reiniciar o aplicativo, o ponto de verificação mais recente será usado.

  • Os pontos de salvamento são versionados usando o SnapshotNameparâmetro da ação. CreateApplicationSnapshot

O Managed Service for Apache Flink criptografa dados armazenados em pontos de verificação e salvamento.