As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Verificações de resiliência para serviços AWS
Este capítulo fornece os detalhes de várias verificações de resiliência realizadas pelos AWS serviços suportados AWS Resilience Hub para garantir que as posturas de resiliência dos aplicativos não sejam afetadas. Essas verificações estimam o objetivo de tempo de recuperação (RTO) e o objetivo de ponto de recuperação (RPO) em relação aos valores definidos na política de resiliência para cada componente do aplicativo ()AppComponent. As avaliações abrangem diferentes tipos de interrupções, ou seja, falhas de aplicativos, de infraestrutura, interrupções de AZ e falhas regionais. No entanto, para executar essas verificações, você deve fornecer permissões relevantes do IAM AWS Resilience Hub para permitir que ele acesse seus recursos. Para saber mais sobre as permissões necessárias do IAM para permitir AWS Resilience Hub o acesso aos recursos e a realização das verificações de resiliência neste capítulo, consulteAWS políticas gerenciadas para AWS Resilience Hub.
AWS serviços
Amazon Elastic File System
Esta seção lista todas as verificações e recomendações de resiliência que são específicas do Amazon Elastic File System. Para obter mais informações sobre o Amazon Elastic File System, consulte a documentação do Amazon Elastic File System.
Tipo de sistema de arquivos
AWS Resilience Hub verifica o tipo de sistema de arquivos: regional ou de uma zona. O tipo de sistema de arquivos afeta sua resiliência no caso de interrupções na infraestrutura ou no AZ. Para obter mais informações sobre os tipos de sistemas de arquivos, consulte Disponibilidade e durabilidade dos sistemas de arquivos Amazon EFS.
Backup do sistema de arquivos
AWS Resilience Hub verifica se um AWS Backup plano está definido para o sistema de arquivos implantado. Além disso, ele verifica se a opção de Cross-Region
backup está ativada, garantindo cobertura para interrupções em nível regional, se exigido por sua política.
Replicação de dados
AWS Resilience Hub verifica se uma replicação de dados do Amazon EFS na região ou entre regiões está definida para o sistema de arquivos implantado. A replicação de dados do Amazon EFS ajuda a melhorar o RTO estimado e o RPO estimado nos níveis de aplicativo, infraestrutura, AZ e região. Além disso, AWS Resilience Hub verifica se ele está combinado com uma região interna AWS Backup para permitir a resiliência do sistema de arquivos em caso de interrupção do aplicativo.
Amazon Relational Database Service e Amazon Aurora
Esta seção lista todas as verificações e recomendações de resiliência específicas para o Amazon Relational Database Service e o Amazon Aurora. Para obter mais informações sobre o Amazon Relational Database Service e o Amazon Aurora, consulte a documentação do Amazon Relational Database Service.
Implantação Single-AZ
AWS Resilience Hub verifica se o banco de dados está implantado como uma única instância e, se determinado, indica que não oferece suporte à instância secundária e à réplica de leitura.
Multi-AZ deployment (Implantação multi-AZ)
AWS Resilience Hub verifica se o banco de dados está implantado com instância secundária ou réplicas de leitura. Se o banco de dados for implantado com réplica de leitura, AWS Resilience Hub valida se ele está implantado em uma AZ diferente para permitir o failover no caso de uma interrupção no AZ.
Backup
AWS Resilience Hub verifica se os seguintes recursos de backup são aplicados em uma instância de banco de dados implantada.
-
AWS Backup plano com opção de backup automático
-
AWS Backup planeje com cópia de backup entre regiões, se exigido por sua política
-
Instantâneos manuais para sistemas de backup de terceiros
Failover entre regiões
AWS Resilience Hub verifica as metas de RTO e RPO definidas na política de resiliência para se recuperar da interrupção regional. Além disso, AWS Resilience Hub pode identificar as seguintes arquiteturas entre regiões para cobrir interrupções regionais:
-
Um backup na região com uma cópia de um instantâneo entre regiões
-
Uma réplica de leitura em outra região
-
Um banco de dados global Amazon Aurora com um cluster secundário em outra região
-
Um banco de dados global Amazon Aurora com um cluster secundário sem cabeçalho em outra região
Failover mais rápido na região
AWS Resilience Hub verifica as metas de RTO e RPO definidas na política de resiliência durante interrupções na infraestrutura ou no AZ. Além disso, AWS Resilience Hub pode identificar as seguintes arquiteturas na região para cobrir interrupções em aplicativos, infraestrutura e AZ:
-
Um backup na região
Uma réplica de leitura em uma AZ diferente
Um cluster Aurora com uma réplica de leitura em outra AZ
Uma instância Multi-AZ do Amazon Relational Database Service (Amazon RDS)
Um cluster Amazon RDS Multi-AZ
Uma única instância do Amazon RDS com uma réplica de leitura em outra AZ
Amazon Simple Storage Service
Esta seção lista todas as verificações e recomendações de resiliência específicas para o Amazon Simple Storage Service (Amazon S3). Para obter mais informações sobre o Amazon S3, consulte a documentação do Amazon S3.
Versionamento
AWS Resilience Hub verifica se um bucket do Amazon S3 está configurado com o versionamento ativado.
Backup programado
AWS Resilience Hub verifica se um AWS Backup plano está definido para o bucket implantado do Amazon Simple Storage Service (Amazon S3). Além disso, ele também verifica se a opção de backup entre regiões está ativada se sua política exigir cobertura para interrupções em nível regional.
Point-in-time recuperação
AWS Resilience Hub verifica se a point-in-time recuperação (PITR) é exigida pela meta de RPO da sua política de resiliência. No entanto, o backup entre regiões não é suportado pelo PITR. Portanto, você usa um AWS Backup plano agendado existente com a opção de backup entre regiões ativada ou cria um novo.
Replicação de dados
AWS Resilience Hub verifica se uma replicação na mesma região (SRR) e uma replicação entre regiões (CRR) estão definidas para o bucket Amazon S3 implantado. A replicação de dados do Amazon S3 melhora o RTO estimado da carga de trabalho e o RPO estimado da carga de trabalho em nível de aplicativo, infraestrutura, AZ e região. Além disso, ele também protege contra a exclusão física do objeto, pois a exclusão de uma versão do objeto não é replicada para o bucket de destino do Amazon S3. Além disso, com base nas metas de RTO definidas em sua política de resiliência, AWS Resilience Hub verifica se o Amazon S3 Replication Time Control (S3 RTC) deve estar ativado ou não. Esse recurso faturável replica 99,99% dos objetos do bucket de origem em 15 minutos.
-
AWS Backup plano com opção de backup automático
-
AWS Backup planeje com cópia de backup entre regiões, se exigido por sua política
-
Instantâneos manuais para sistemas de backup de terceiros
Amazon DynamoDB
Esta seção lista todas as verificações e recomendações de resiliência específicas para o Amazon DynamoDB. Para obter mais informações sobre o Amazon DynamoDB, consulte a documentação do Amazon DynamoDB.
Backup programado
AWS Resilience Hub verifica se um backup já está definido para a tabela implantada. Além disso, ele também verifica se o backup entre regiões deve ser configurado para sua política, caso exija cobertura para interrupções em nível regional.
Point-in-time recuperação
AWS Resilience Hub verifica se a point-in-time recuperação (PITR) é necessária de acordo com a meta de RPO da sua política de resiliência. No entanto, o backup entre regiões não é suportado pelo PITR. Portanto, você usa um AWS Backup plano agendado existente com a opção de backup entre regiões ativada ou cria um novo.
Tabela global
AWS Resilience Hub verifica se a tabela implantada do Amazon DynamoDB está definida como uma tabela global com uma ou mais réplicas em outras regiões. A configuração da Tabela Global melhora o RTO estimado da carga de trabalho e o RPO estimado da carga de trabalho em nível regional e também fornece a capacidade de trabalhar nos modos multirregionais ativo-ativo ou ativo-passivo. AWS Backup ou o Amazon DynamoDB PITR pode ser usado em uma das regiões para lidar com interrupções de aplicativos.
Amazon Elastic Compute Cloud
Esta seção lista todas as verificações e recomendações de resiliência que são específicas para o Amazon Elastic Compute Cloud. Para obter mais informações sobre o Amazon Elastic Compute Cloud, consulte a documentação do Amazon Elastic Compute Cloud.
Instância com estado
AWS Resilience Hub identifica uma EC2 instância da Amazon como uma instância com estado se um dos seguintes critérios for atendido:
-
Se o
DeleteOnTermination
atributo for definido como false para pelo menos um volume do Amazon Elastic Block Store (Amazon EBS) anexado a essa instância. -
Se o Amazon Data Lifecycle Manager ou um AWS Backup plano estiver vinculado à EC2 instância da Amazon ou a pelo menos um volume do Amazon EBS.
-
AWS Elastic Disaster Recovery É usado para replicar seus volumes de armazenamento de EC2 instâncias da Amazon.
nota
Se uma EC2 instância da Amazon não atender a nenhum dos critérios acima, AWS Resilience Hub trate-a como uma EC2 instância da Amazon sem estado.
Grupos do Auto Scaling
AWS Resilience Hub verifica se há um grupo de EC2 instâncias sem estado da Amazon. Se descoberto, é recomendável orquestrar o mesmo usando grupos de Auto Scaling (ASG) com configuração Multi-AZ. Se um ASG existente for identificado, o ARH verificará se ele está configurado em várias zonas de disponibilidade. Se o ASG também for definido usando apenas EC2 instâncias spot da Amazon, é recomendável aumentar sua capacidade com instâncias EC2 Amazon sob demanda para melhorar a resiliência quando as instâncias spot da EC2 Amazon não estiverem disponíveis.
EC2 Frota da Amazon
AWS Resilience Hub identifica a Amazon EC2 Fleet e verifica se ela está definida como implantação Multi-AZ e também se usa somente instâncias spot da Amazon EC2 . Definir uma EC2 frota da Amazon como implantação Multi-AZ melhorará sua resiliência no caso de uma interrupção no AZ. Aumentar uma EC2 frota da Amazon com instâncias sob demanda melhorará sua resiliência quando as instâncias spot não estiverem disponíveis.
Amazon EBS
Esta seção lista todas as verificações e recomendações de resiliência que são específicas do Amazon EBS. Para obter mais informações sobre o Amazon EBS, consulte a documentação do Amazon EBS.
Backup programado
AWS Resilience Hub verifica se um ou ambos os itens a seguir estão definidos para seus volumes do Amazon EBS.
-
Uma regra de backup para um volume específico do Amazon EBS anexado à sua EC2 instância da Amazon.
-
Uma regra de backup para criar uma AMI baseada no Amazon EBS-backed para sua instância da Amazon. EC2
-
Instantâneos manuais para sistemas de backup de terceiros.
Além disso, se sua política exigir cobertura para interrupções em nível regional, AWS Resilience Hub verifique se sua regra de backup tem a opção de backup entre regiões ativada.
Backup e replicação de dados
AWS Resilience Hub identifica que um volume do Amazon EBS é considerado um volume com estado se um dos seguintes critérios for atendido:
-
Se o
DeleteOnTermination
atributo estiver definido como falso para esse volume do Amazon EBS. -
Se o Amazon Data Lifecycle Manager ou um AWS Backup plano estiver associado a esse volume do Amazon EBS ou à EC2 instância da Amazon à qual ele está vinculado.
-
AWS Elastic Disaster Recovery É usado para replicar seus volumes de armazenamento de EC2 instâncias da Amazon.
AWS Lambda
Esta seção lista todas as verificações e recomendações de resiliência específicas do. AWS Lambda Para obter mais informações sobre AWS Lambda, consulte a AWS Lambda documentação.
Acesso ao Amazon VPC do cliente
AWS Resilience Hub identifica uma AWS Lambda função conectada à VPC. AWS Lambda A conexão com sub-redes diferentes AZs de sua Amazon VPC permite resiliência funcional em caso de interrupção do AZ.
Fila de mensagens não entregues
AWS Resilience Hub verifica se uma AWS Lambda função tem uma fila de letras mortas (DLQ) anexada a ela para armazenar solicitações com falha. Anexar um DLQ à AWS Lambda função permite evitar a perda de dados das solicitações e tentar processar novamente as solicitações com falha em um estágio posterior.
Amazon Elastic Kubernetes Service
Esta seção lista todas as verificações e recomendações de resiliência que são específicas do Amazon Elastic Kubernetes Service (Amazon EKS). Para obter mais informações sobre o Amazon EKS, consulte a documentação do Amazon EKS.
Multi-AZ deployment (Implantação multi-AZ)
AWS Resilience Hub identifica se a implantação do pod está sendo executada em vários nós de trabalho em vários AZs. Um cluster adicional do Amazon EKS em outra região é necessário se sua política de resiliência exigir cobertura em caso de interrupção regional. Esse cluster adicional do Amazon EKS também é verificado para implantações de pods que são distribuídas entre vários nós de trabalho em vários AZs.
Implantação vs. ReplicaSet
AWS Resilience Hub verifica se você está usando objetos ReplicaSets de pod em vez de implantar. A substituição de ReplicaSets nossos objetos de pod pela implantação simplifica as atualizações do pod para uma nova versão do software e inclui outros recursos úteis.
Manutenção de implantação
AWS Resilience Hub verifica se as seguintes melhores práticas são usadas para implantação:
-
Usando o Pod Disruption Budget (PDB) — O uso do PDB possibilita melhorar a disponibilidade definindo um limite no número de pods na carga de trabalho que podem ser interrompidos a qualquer momento.
-
Substituição de grupos de nós autogerenciados por grupos de nós gerenciados do Amazon EKS — Essa substituição simplifica as atualizações de imagens dos nós de trabalho durante a manutenção.
-
Suporte a solicitações dinâmicas de CPU e memória por implantação — Essas solicitações ajudam o Kubernetes a selecionar um nó que atenda às necessidades de um pod.
-
Configuração de sondas de atividade e prontidão para todos os contêineres — A configuração de sondas de atividade ajuda a melhorar a resiliência ao reiniciar os pods não funcionais. A configuração das sondas de prontidão possibilita melhorar a disponibilidade desviando o tráfego dos pods ocupados.
-
Configurando Karpenter, Cluster Autoscaler ou — AWS Fargate Essas configurações permitem que a infraestrutura do cluster Amazon EKS cresça e atenda às demandas de carga de trabalho.
-
Configuração do Horizontal Pod Autoscaler — Essa configuração ajuda o cluster Amazon EKS a escalar automaticamente a carga de trabalho para atender à demanda de processamento de solicitações.
Amazon Simple Notification Service
Esta seção lista todas as verificações e recomendações de resiliência que são específicas do Amazon Simple Notification Service (Amazon SNS). Para obter mais informações sobre o Amazon SNS, consulte a documentação do Amazon SNS.
Assinaturas de tópicos
AWS Resilience Hub verifica se o tópico do Amazon SNS tem pelo menos uma assinatura anexada para garantir que as mensagens recebidas não sejam perdidas.
Amazon Simple Queue Service
Esta seção lista todas as verificações e recomendações de resiliência que são específicas do Amazon Simple Queue Service (Amazon SQS). Para obter mais informações sobre o Amazon SQS, consulte a documentação do Amazon SQS.
Fila de mensagens não entregues
AWS Resilience Hub verifica se a fila do Amazon SQS tem um DLQ associado a ela para lidar com mensagens que não podem ser entregues aos assinantes com sucesso.
Amazon Elastic Container Service
Esta seção lista todas as verificações e recomendações de resiliência que são específicas do Amazon Elastic Container Service (Amazon ECS). Para obter mais informações sobre o Amazon ECS, consulte a documentação do Amazon ECS.
Multi-AZ deployment (Implantação multi-AZ)
AWS Resilience Hub verifica se as tarefas ou serviços do Amazon ECS estão sendo executados em várias tarefas AZs com base no Amazon EC2 ou nos tipos de AWS Fargate lançamento. Um cluster adicional do Amazon ECS em outra região é necessário se sua apólice precisar de cobertura para interrupções regionais. O cluster adicional também é verificado quanto à execução de tarefas ou serviços em vários AZs.
Elastic Load Balancing
Esta seção lista todas as verificações e recomendações de resiliência que são específicas do Elastic Load Balancing. Para obter mais informações sobre o Elastic Load Balancing, consulte a documentação do Elastic Load Balancing.
Multi-AZ deployment (Implantação multi-AZ)
AWS Resilience Hub verifica se o Elastic Load Balancing está sendo executado em vários. AZs
Um Elastic Load Balancing adicional em uma região diferente é necessário se sua apólice precisar de cobertura para interrupções regionais. O Elastic Load Balancing adicional, localizado em uma região diferente, também é verificado para sua implantação em várias. AZs
Amazon API Gateway
Esta seção lista todas as verificações e recomendações de resiliência que são específicas do Amazon API Gateway. Para obter mais informações sobre o Amazon API Gateway, consulte a documentação do Amazon API Gateway.
Implantação entre regiões
Se sua política precisar considerar uma interrupção regional, AWS Resilience Hub verificará se há uma implantação adicional do recurso de API do Amazon API Gateway em uma região diferente.
Implantação privada de API Multi-AZ
AWS Resilience Hub verifica se sua API está definida como privada no Amazon API Gateway. O privado APIs deve receber tráfego por meio do endpoint da interface Amazon VPC, que é implantado em vários. AZs
Amazon DocumentDB
Esta seção lista todas as verificações e recomendações específicas do Amazon DocumentDB. Para obter mais informações sobre o Amazon DocumentDB, consulte a documentação do Amazon DocumentDB.
Multi-AZ deployment (Implantação multi-AZ)
AWS Resilience Hub verifica se o cluster Amazon DocumentDB está implantado em vários. AZs Um cluster secundário adicional do Amazon DocumentDB é necessário em uma região diferente se sua política exigir cobertura para interrupções regionais. O cluster adicional do Amazon DocumentDB, localizado em uma região diferente, também é verificado quanto à sua execução em várias. AZs
Cluster elástico e implantação Multi-AZ
AWS Resilience Hub verifica se os fragmentos de cluster elásticos do Amazon DocumentDB estão usando réplicas de leitura implantadas em diferentes. AZs
Cluster elástico e instantâneos manuais
AWS Resilience Hub verifica se os snapshots manuais são criados regularmente para um cluster elástico do Amazon DocumentDB. Os instantâneos manuais permitem maior persistência e oferecem flexibilidade na configuração da frequência dos instantâneos de acordo com as necessidades da sua empresa.
NAT Gateway
Esta seção lista todas as verificações e recomendações específicas do NAT Gateway. Para obter mais informações sobre os gateways NAT, consulte NAT Gateways.
Multi-AZ deployment (Implantação multi-AZ)
AWS Resilience Hub verifica se o NAT Gateway está implantado em vários. AZs Uma implantação adicional do NAT Gateway é necessária em uma região diferente se sua política exigir cobertura para interrupções regionais. O NAT Gateway adicional, localizado em uma região diferente, também é verificado para sua implantação em várias AZs.
Amazon Route 53
Esta seção lista todas as verificações e recomendações específicas do Amazon Route 53. Para obter mais informações sobre o Amazon Route 53, consulte a documentação do Amazon Route 53.
Multi-AZ deployment (Implantação multi-AZ)
AWS Resilience Hub verifica se o registro da zona hospedada do Amazon Route 53 está definido com vários destinos na mesma região e se esses alvos estão implantados em vários AZs. Se sua política exigir cobertura para interrupções regionais, AWS Resilience Hub verifique se o registro da zona hospedada do Amazon Route 53 está definido em várias regiões com vários alvos por região e se esses alvos estão implantados em vários. AZs
Amazon Application Recovery Controller (ARC)
Esta seção lista todas as verificações e recomendações específicas do Amazon Application Recovery Controller (ARC) (ARC). Para obter mais informações sobre o ARC, consulte a documentação do ARC.
Multi-AZ deployment (Implantação multi-AZ)
AWS Resilience Hub verifica se recursos semelhantes estão implantados em várias regiões e recomenda, como melhor prática, definir verificações de prontidão do ARC para aumentar sua disponibilidade e prontidão no caso de uma interrupção regional. Você será notificado de que incorrerá em cobranças adicionais por hora.
Servidor FSx de arquivos Amazon para Windows
Esta seção lista todas as verificações e recomendações específicas do Amazon FSx para Windows File Server. Para obter mais informações sobre o Amazon FSx para Windows File Server, consulte a documentação do Amazon FSx para Windows File Server.
Tipo de sistema de arquivos
AWS Resilience Hub verifica o tipo de sistema de arquivos: ou. Regional
One Zone
O tipo de sistema de arquivos afeta sua resiliência no caso de interrupções na infraestrutura ou no AZ. Para obter mais informações sobre os tipos de sistemas de arquivos, consulte Amazon EFS.
Backup do sistema de arquivos
AWS Resilience Hub verifica se um AWS Backup está definido para o sistema de arquivos implantado. Além disso, ele também verifica se a cross-Region backup
opção está ativada se sua apólice exige cobertura para interrupções em nível regional.
Replicação de dados
AWS Resilience Hub verifica se uma tarefa de replicação de AWS DataSync dados agendada na região ou entre regiões está definida para o sistema de arquivos implantado.
AWS DataSync a tarefa programada de replicação de dados pode melhorar o RTO estimado da carga de trabalho e o RPO estimado da carga de trabalho nos níveis de infraestrutura, AZ e região. Além disso, ele pode ser combinado com uma região interna AWS Backup para recuperação em caso de interrupção do aplicativo.
AWS Step Functions
Esta seção lista todas as verificações e recomendações específicas do AWS Step Functions. Para obter mais informações sobre AWS Step Functions, consulte a AWS Step Functions documentação.
Controle de versão e alias
AWS Resilience Hub verifica se o AWS Step Functions fluxo de trabalho usa controle de versão e alias para melhorar o tempo de reimplantação.
Implantação entre regiões
AWS Resilience Hub verifica se o AWS Step Functions fluxo de trabalho do mesmo tipo de fluxo de trabalho está implantado em uma região diferente para se recuperar no caso de uma interrupção regional.
Amazon ElastiCache (Redis OSS)
Esta seção lista todas as verificações e recomendações específicas da Amazon ElastiCache (Redis OSS).
Para obter mais informações sobre a Amazon ElastiCache (Redis OSS), consulte a documentação da Amazon ElastiCache .
Implantação Single-AZ
AWS Resilience Hub verifica se o cluster Amazon ElastiCache (Redis OSS) está implantado como um único nó ou com todos os seus nós em uma única zona de disponibilidade.
Implantação Single-AZ
AWS Resilience Hub valida se o cluster Amazon ElastiCache (Redis OSS) está implantado como um grupo de replicação (para clusters habilitados no Modo Cluster e Desativados no Modo Cluster) em várias zonas de disponibilidade para permitir o failover no caso de uma interrupção na zona de disponibilidade.
Failover entre regiões
AWS Resilience Hub verifica as metas de RTO e RPO definidas na política de resiliência para se recuperar de uma interrupção regional. Além disso, AWS Resilience Hub pode identificar clusters de armazenamento de dados globais da Amazon ElastiCache (Redis OSS) implantados em várias regiões.
Backup
AWS Resilience Hub verifica se os seguintes recursos de backup são aplicados em um Amazon implantado ElastiCache (Redis OSS) ou em um cluster autoprojetado:
-
Backup automático
-
Backup manual para sistemas de backup de terceiros
AWS Resilience Hub não recomendará o backup como método de recuperação se você não estiver usando o backup. No entanto, você pode redefinir a camada de cache em caso de inconsistência de dados e recriar os dados do armazenamento primário.
Failover mais rápido na região
AWS Resilience Hub verifica as metas de RTO e RPO definidas na política de resiliência durante interrupções na infraestrutura ou no AZ. Além disso, AWS Resilience Hub pode identificar as seguintes arquiteturas na região para se recuperar de interrupções na infraestrutura e no AZ:
-
Instância secundária de nó em espera em uma zona de disponibilidade diferente para o tipo de cluster do Amazon ElastiCache (Redis OSS) desativado no modo de cluster.
-
Instância secundária de nó em espera em uma zona de disponibilidade diferente para cada fragmento para o tipo de cluster Amazon ElastiCache (Redis OSS) habilitado para o modo de cluster.