Automatizar sua estratégia de DR - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Automatizar sua estratégia de DR

Opcionalmente, escolha entre implementar a automação total ou parcial para obter um melhor controle da recuperação de desastres. Se você estiver usando a opção DR de backup e restauração, poderá automatizar seus backups usando o AWS Backup, o qual é compatível com todos os bancos de dados do Amazon RDS, bem como com as tabelas do DynamoDB, Amazon DocumentDB e Amazon Neptune.

Detecção de eventos de desastre

Para reduzir o tempo de recuperação, considere automatizar a detecção de um evento regional, que pode então iniciar o failover para a região de DR. Para implementar a detecção automatizada para obter um RTO agressivo, você pode criar uma solução baseada em verificações de integridade. Essas verificações de integridade não param nos heartbeats (que verificam se os módulos do ambiente de gerenciamento e do plano de dados em uma rede podem se comunicar entre si), mas avaliam mais profundamente a natureza inter-relacionada dos componentes da aplicação para chegar a uma previsão precisa. No entanto, uma solução automatizada pode acarretar o risco de alarmes falsos, o que pode levar a failovers desnecessários. Tenha cuidado nesse caso, pois failovers desnecessários introduzem problemas de disponibilidade para sua empresa. Você também pode criar substituições manuais no fluxo de trabalho para confirmar que o failover foi realizado. Assine o feed RSS Service Health Dashboard para se manter em dia com as interrupções em nível de serviço. Além disso, você pode usar o AWS Health Dashboard(requer uma AWS conta) em sua região e conta principais para ficar ciente dos eventos que podem afetar sua conta. Isso pode ajudar você a tomar uma decisão informada sobre failover no caso de um evento regional.

Failover

Independentemente da estratégia de DR escolhida, é possível criar soluções personalizadas de automação de DR para realizar o failover na região de DR. Essa automação pode minimizar a necessidade de intervenção manual e fornecer maior controle no teste da sua solução de DR. Você pode escolher entre o AWS serviço APIs, que é AWS fornecido em várias linguagens JavaScript, como Python, PHP, .NET, Ruby, Java, Go, Node.js e C++, com base na preferência da sua organização. Para criar uma automação que use esses AWS serviços APIs, você deve primeiro se concentrar em transformar a infraestrutura do banco de dados em código na forma de AWS CloudFormation modelos do Terraform. Esses modelos podem ajudar a automatizar o failover de vários bancos de dados e também manter a ordem na qual os componentes da aplicação e do banco de dados são reativados na região de DR.

Para fins de DR, recomendamos se concentrar nesses dois objetivos:

  • As CloudFormation pilhas existentes devem exportar informações pertinentes sobre seus bancos de dados, incluindo nomes de instâncias e endpoints. Seus processos de automação podem se referir a esses valores de exportação dentro de uma região e realizar operações que serão úteis para suas operações de DR.

  • Se você tem recursos em produção, mas não tem uma CloudFormation pilha associada, você deve se concentrar em criar pilhas para esses recursos. Certifique-se também de que essas pilhas cubram os valores de exportação corretos, conforme mencionado no ponto anterior.

Depois de atingir essas duas metas, você pode criar soluções de automação no idioma de sua organização para aproveitar CloudFormation as exportações e executar automaticamente as ações de transição necessárias no caso de um desastre. Por exemplo, se você tiver um armazenamento de dados global ElastiCache (Redis OSS) implantado como CloudFormation modelo, o código de automação terá acesso às CloudFormation exportações que fornecem detalhes sobre o armazenamento de dados global. No caso de um desastre, o código pode promover automaticamente o armazenamento de dados secundário para o armazenamento de dados primário sem qualquer intervenção manual usando o serviço ElastiCache (Redis OSS). APIs

Em um cenário típico, a automação deve ser escalável para vários bancos de dados em sua organização. É possível escalar suas soluções de automação para vários bancos de dados usando AWS Step Functions ou AWS Batch.