REL09-BP01 Identifique e faça backup de todos os dados que precisam ser copiados ou reproduza os dados das fontes - AWS Estrutura Well-Architected

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

REL09-BP01 Identifique e faça backup de todos os dados que precisam ser copiados ou reproduza os dados das fontes

Compreenda e use os recursos de backup dos serviços e recursos de dados usados pela workload. A maioria dos serviços oferece recursos para fazer backup dos dados da workload.

Resultado desejado: as fontes de dados foram identificadas e classificadas com base na criticidade. Em seguida, estabeleça uma estratégia para recuperação de dados com base noRPO. A estratégia envolve fazer backup dessas fontes de dados ou poder reproduzir dados de outras fontes. No caso de perda de dados, a estratégia implementada permite a recuperação ou a reprodução dos dados dentro do definido RPO RTO e.

Fase de maturidade da nuvem: fundamental

Práticas comuns que devem ser evitadas:

  • Não estar ciente de todas as fontes de dados para a workload e sua criticidade.

  • Não fazer backups de fontes de dados essenciais.

  • Fazer backups apenas de algumas fontes de dados sem usar a criticidade como critério.

  • Não definido ou RPO a frequência de backup não pode ser atendidaRPO.

  • Não avaliar a necessidade de um backup ou se os dados podem ser reproduzidos de outras fontes.

Benefícios de implementar esta prática recomendada: identificar os locais onde os backups são necessários e implementar um mecanismo para criar backups, ou ser capaz de reproduzir os dados de uma fonte externa, melhora a capacidade de restaurar e recuperar dados durante uma interrupção.

Nível de risco exposto se esta prática recomendada não for estabelecida: Alto

Orientação para implementação

Todos os armazenamentos de AWS dados oferecem recursos de backup. Serviços como Amazon RDS e Amazon DynamoDB também oferecem suporte ao backup automatizado que point-in-time permite a recuperação PITR (), o que permite restaurar um backup a qualquer momento até cinco minutos ou menos antes do horário atual. Muitos AWS serviços oferecem a capacidade de copiar backups para outro Região da AWS. AWS Backup é uma ferramenta que permite centralizar e automatizar a proteção de dados em todos AWS os serviços. AWS Elastic Disaster Recoverypermite copiar cargas de trabalho completas do servidor e manter a proteção contínua dos dados no local, entre AZ ou entre regiões, com um objetivo de ponto de recuperação () RPO medido em segundos.

O Amazon S3 pode ser usado como um destino de backup para fontes de dados autogerenciadas e AWS gerenciadas. AWS serviços como Amazon EBSRDS, Amazon e Amazon DynamoDB têm recursos integrados para criar backups. É possível também usar um software de backup de terceiros.

Os dados locais podem ser copiados Nuvem AWS usando AWS Storage Gatewayou AWS DataSync. Os buckets do Amazon S3 podem ser usados para armazenar esses dados na AWS. O Amazon S3 oferece vários níveis de armazenamento, como Amazon S3 Glacier ou S3 Glacier Deep Archive para reduzir o custo do armazenamento de dados.

É possível atender às necessidades de recuperação de dados reproduzindo os dados de outras fontes. Por exemplo, os nós de ElastiCache réplica da Amazon ou as réplicas de RDS leitura da Amazon podem ser usados para reproduzir dados se o primário for perdido. Nos casos em que fontes como essa podem ser usadas para atingir seu objetivo de ponto de recuperação (RPO) e objetivo de tempo de recuperação (RTO), talvez você não precise de um backup. Outro exemplo, se estiver trabalhando com a AmazonEMR, talvez não seja necessário fazer backup do seu armazenamento de HDFS dados, desde que você possa reproduzir os dados na Amazon a EMR partir do Amazon S3.

Ao selecionar uma estratégia de backup, considere o tempo necessário para recuperar os dados. Ele depende do tipo de backup (no caso de uma estratégia de backup) ou da complexidade do mecanismo de reprodução de dados. Esse tempo deve estar dentro da carga RTO de trabalho.

Etapas de implementação

  1. Identifique todas as fontes de dados para a workload. Os dados podem ser armazenados em vários recursos, como bancos de dados, volumes, sistemas de arquivos, sistemas de registro em log e armazenamento de objetos. Consulte a seção Recursos para encontrar documentos relacionados sobre os diferentes AWS serviços em que os dados são armazenados e a capacidade de backup que esses serviços oferecem.

  2. Classifique as fontes de dados com base na criticidade. Diferentes conjuntos de dados terão diferentes níveis de criticidade para uma workload e, portanto, diferentes requisitos de resiliência. Por exemplo, alguns dados podem ser críticos e exigir RPO quase zero, enquanto outros dados podem ser menos críticos e podem tolerar uma perda maior RPO e alguma perda de dados. Da mesma forma, conjuntos de dados diferentes também podem ter RTO requisitos diferentes.

  3. Use AWS nossos serviços de terceiros para criar backups dos dados. AWS Backupé um serviço gerenciado que permite criar backups de várias fontes de dados no AWS. AWS Elastic Disaster Recoverymanipula a replicação automatizada de dados em menos de um segundo para um. Região da AWS A maioria dos AWS serviços também tem recursos nativos para criar backups. A AWS Marketplace tem muitas soluções que também fornecem esses recursos. Consulte os Recursos listados abaixo para obter informações sobre como criar backups de dados de vários serviços da AWS .

  4. Para dados sem backup, estabeleça um mecanismo de reprodução de dados. Você pode optar por não fazer backup dos dados que podem ser reproduzidos de outras fontes por vários motivos. Às vezes, pode ser mais barato reproduzir dados de fontes se necessário, em vez de criar um backup, pois pode haver um custo associado ao armazenamento de backups. Outro exemplo é quando a restauração de um backup leva mais tempo do que a reprodução dos dados das fontes, resultando em uma violação. RTO Nestas situações, considere concessões e estabeleça um processo bem definido de como os dados podem ser reproduzidos dessas fontes quando a recuperação de dados for necessária. Por exemplo, se você carregou dados do Amazon S3 em um data warehouse (como o Amazon Redshift) MapReduce ou cluster (como o EMR Amazon) para fazer análises desses dados, esse pode ser um exemplo de dados que podem ser reproduzidos de outras fontes. Desde que os resultados dessas análises sejam armazenados em algum lugar ou sejam reproduzíveis, você não sofrerá perda de dados devido a uma falha no data warehouse ou MapReduce no cluster. Outros exemplos que podem ser reproduzidos a partir de fontes incluem caches (como a Amazon ElastiCache) ou réplicas de RDS leitura.

  5. Estabeleça uma cadência para fazer backup dos dados. Criar backups de fontes de dados é um processo periódico e a frequência deve depender doRPO.

Nível de esforço do plano de implementação: Moderado

Recursos

Práticas recomendadas relacionadas:

REL13-BP01 Definir objetivos de recuperação para tempo de inatividade e perda de dados

REL13-BP02 Use estratégias de recuperação definidas para atender aos objetivos de recuperação

Documentos relacionados:

Vídeos relacionados:

Exemplos relacionados: