REL09-BP01 Identificar todos los datos de los que se debe hacer una copia de seguridad y crearla o reproducir los datos a partir de los orígenes
Conozca y use las funciones de copia de seguridad de los servicios y recursos de datos usados por su carga de trabajo. La mayoría de los servicios ofrecen capacidades para realizar copias de seguridad de los datos de la carga de trabajo.
Resultado deseado: los orígenes de datos se han identificado y clasificado en función del nivel de criticidad. A continuación, establece una estrategia de recuperación de datos basada en el RPO. Esta estrategia supone crear una copia de seguridad de estos orígenes de datos o tener la capacidad de reproducir datos desde otros orígenes. En el caso de la pérdida de datos, la estrategia implementada permite la recuperación o reproducción de datos dentro de los RPO y RTO definidos.
Fase de madurez de la nube: básica
Antipatrones usuales:
-
No ser consciente de todos los orígenes de datos para la carga de trabajo y su nivel de criticidad.
-
No realizar copias de seguridad de orígenes de datos críticos.
-
Realizar copias de seguridad solamente de algunos orígenes de datos sin usar la criticidad como criterio.
-
RPO sin definir, o una frecuencia de copias de seguridad que no puede ajustarse al RPO.
-
No evaluar si una copia de seguridad es necesaria o si se pueden reproducir datos desde otros orígenes.
Beneficios de establecer esta práctica recomendada: identificar los lugares en los que las copias de seguridad son necesarias e implementar un mecanismo para crear copias de seguridad, o ser capaz de reproducir los datos desde una fuente externa mejora la capacidad de restaurar y recuperar datos durante una interrupción.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: alto
Guía para la implementación
Todos los almacenes de datos de AWS ofrecen capacidades de copia de seguridad. En los servicios como Amazon RDS y Amazon DynamoDB también se pueden hacer copias de seguridad automatizadas, lo que facilita la recuperación a un momento dado (PITR). De este modo, podrá restaurar una copia de seguridad a cualquier momento hasta cinco minutos (o menos) antes del momento actual. Muchos servicios de AWS ofrecen la capacidad de copiar copias de seguridad en otra Región de AWS. AWS Backup es una herramienta que permite centralizar y automatizar la protección de datos entre servicios de AWS. AWS Elastic Disaster Recovery
Amazon S3 puede usarse como destino de copias de seguridad para los orígenes de datos autoadministrados y administrados por AWS. Los servicios de AWS como Amazon EBS, Amazon RDS y Amazon DynamoDB tienen capacidades integradas para crear copias de seguridad. También se puede usar software de copias de seguridad de terceros.
Se pueden realizar copias de seguridad de los datos locales en Nube de AWS con AWS Storage Gateway o AWS DataSync. Los buckets de Amazon S3 se pueden usar para almacenar estos datos en AWS. Amazon S3 ofrece varios niveles de almacenamiento, como Amazon S3 Glacier o S3 Glacier Deep Archive para reducir el coste del almacenamiento de datos.
Es posible que pueda satisfacer las necesidades de recuperación de datos reproduciendo los datos desde otros orígenes. Por ejemplo, los nodos de réplicas de Amazon ElastiCache o bien las réplicas de lectura de Amazon RDS podrían usarse para reproducir datos si se pierde la principal. En casos en los que orígenes como este puedan usarse para cumplir su objetivo de punto de recuperación (RPO) y su objetivo de tiempo de recuperación (RTO), puede que no necesite una copia de seguridad. Otro ejemplo: si trabaja con Amazon EMR, puede que no sea necesario crear copias de seguridad de sus almacenes de datos HDFS, en la medida en que puede reproducir los datos enAmazon EMR desde Amazon S3
Al seleccionar una estrategia de copia de seguridad, piense en el tiempo que se necesita para recuperar los datos. El tiempo necesario para recuperar datos depende del tipo de copia de seguridad (en el caso de una estrategia de copia de seguridad) o de la complejidad del mecanismo de reproducción de datos. Este tiempo debería ajustarse al RTO de la carga de trabajo.
Pasos para la implementación
-
Identifique todos los orígenes de datos para la carga de trabajo. Los datos se pueden almacenar en diversos recursos, como bases de datos
, volúmenes, sistemas de archivos, sistemas de registro y almacenamiento de objetos. Consulte la sección Recursos para encontrar Documentos relacionados sobre distintos servicios deAWS en los que se almacenan los datos y la capacidad de copia de seguridad que proporcionan estos servicios. -
Clasifique los orígenes de datos en función de su criticidad. Los distintos conjuntos de datos tendrán diferentes niveles de criticidad para una carga de trabajo y, por tanto, distintos requisitos de resiliencia. Por ejemplo, algunos datos podrían ser críticos y requerir un RPO cercano a cero, mientras que otros datos podrían ser menos críticos y tolerar un RPO más alto y cierta pérdida de datos. Del mismo modo, los distintos conjuntos de datos podrían tener también diferentes requisitos en cuanto al RTO.
-
Utilice AWS o servicios de terceros para crear copias de seguridad de los datos. AWS Backup es un servicio administrado que permite la creación de copias de seguridad de diferentes orígenes de datos en AWS. AWS Elastic Disaster Recovery
administra la replicación automatizada de datos en menos de un segundo a una Región de AWS. La mayoría de los servicios de AWS también disponen de capacidades nativas para crear copias de seguridad. AWS Marketplace tiene muchas soluciones que ofrecen también estas capacidades. Consulte la sección Recursos que aparece a continuación para ver información sobre cómo crear copias de seguridad de datos desde distintos servicios de AWS. -
En el caso de los datos que no tengan copia de seguridad, establezca un mecanismo de reproducción de datos. Puede decidir no crear una copia de seguridad de datos que puedan reproducirse desde otros orígenes y por distintos motivos. Podría darse una situación en la que sea más barato reproducir datos de orígenes cuando sea necesario en lugar de crear una copia de seguridad, ya que podría existir un coste asociado con el almacenamiento de copias de seguridad. Otro ejemplo es cuando la restauración desde una copia de seguridad tarda más tiempo que la reproducción de los datos desde el origen, lo que implica un incumplimiento del RTO. En tales situaciones, sopese los pros y los contras y establezca un proceso bien definido sobre cómo se pueden reproducir los datos desde estos orígenes cuando sea necesaria una recuperación de los datos. Por ejemplo, si ha cargado datos desde Amazon S3 en un almacenamiento de datos (como Amazon Redshift) o un clúster de MapReduce (como Amazon EMR) para analizar dichos datos, esto podría ser un ejemplo de datos que se pueden reproducir desde otros orígenes. Siempre y cuando los resultados de estos análisis se almacenen en algún lugar o sean reproducibles, no sufriría una pérdida de datos por un error en el almacenamiento de datos o el clúster de MapReduce. Otros ejemplos que se pueden reproducir desde el origen son las cachés (como Amazon ElastiCache) o las réplicas de lectura de RDS.
-
Establezca una cadencia de copia de seguridad de los datos. La creación de copias de seguridad de orígenes de datos es un proceso periódico y la frecuencia debería depender del RPO.
Nivel de esfuerzo para el plan de implementación: moderado.
Recursos
Prácticas recomendadas relacionadas:
REL13-BP01 Definir objetivos de recuperación para la inactividad y la pérdida de datos
REL13-BP02 Usar estrategias de recuperación definidas para cumplir los objetivos de recuperación
Documentos relacionados:
-
What Is AWS Backup? (¿Qué es AWS Backup?)
-
What is AWS DataSync? (¿Qué es AWS DataSync?)
-
What is Volume Gateway? (¿Qué es una puerta de enlace de volumen?)
-
Socio de APN: socios que pueden ayudar con la copia de seguridad
-
AWS Marketplace: products that can be used for backup
(AWS Marketplace: productos que pueden usarse para la copia de seguridad) -
Backing Up Amazon EFS (Copia de seguridad de Amazon EFS)
-
Backing up Amazon FSx for Windows File Server (Copia de seguridad de Amazon FSx para Windows File Server)
-
Creating a DB Cluster Snapshot in Neptune (Creación de una instantánea de base de datos en Neptune)
-
Creating an EventBridge Rule That Triggers on a Schedule (Creación de una regla de EventBridge que se ejecuta según una programación)
-
Replicación entre regiones con Amazon S3
-
On-Demand Backup and Restore for DynamoDB (Copia de seguridad y restauración bajo demanda para DynamoDB)
-
Trabajo con instantáneas de índice en Amazon OpenSearch Service
-
What is AWS Elastic Disaster Recovery? (¿Qué es AWS Elastic Disaster Recovery?
Vídeos relacionados:
-
AWS re:Invent 2021 - Backup, disaster recovery, and ransomware protection with AWS
(AWS re:Invent 2021: Copia de seguridad, recuperación de desastres y protección contra ransomware con AWS) -
AWS Backup Demo: Cross-Account and Cross-Region Backup
(Demostración de AWS Backup: copia de seguridad entre cuentas y entre regiones) -
AWS re:Invent 2019: Deep dive on AWS Backup, ft. Rackspace (STG341)
(AWS re:Invent 2019: Análisis en profundidad en AWS Backup, ft. Rackspace)
Ejemplos relacionados:
-
Well-Architected Lab - Implementing Bi-Directional Cross-Region Replication (CRR) for Amazon S3
(Laboratorio de Well-Architected: Implementación de la replicación bidireccional entre regiones (CRR) para Amazon S3) -
Well-Architected Lab - Testing Backup and Restore of Data
(Laboratorio de Well-Architected: Probar la copia de seguridad y restauración de los datos) -
Well-Architected Lab - Backup and Restore with Failback for Analytics Workload
(Laboratorio de Well-Architected: Copia de seguridad y restauración con conmutación por recuperación para cargas de trabajo de análisis) -
Well-Architected Lab - Disaster Recovery - Backup and Restore
(Laboratorio de Well-Architected: Recuperación de desastres, copia de seguridad y restauración)