Automatización de la estrategia de recuperación de desastres - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Automatización de la estrategia de recuperación de desastres

Si lo desea, puede optar por implementar la automatización total o parcial para tener un mejor control de la recuperación de desastres. Si utiliza la opción de recuperación de desastres (DR) de respaldo y restauración, puede automatizar sus copias de seguridad mediante AWS Backup, que admite todas las bases de datos de Amazon RDS, así como las tablas de DynamoDB, Amazon DocumentDB y Amazon Neptune.

Detección de desastres

Para acortar el tiempo de recuperación, puede considerar la automatización de la detección de un evento en toda la región, lo que, a su vez, puede iniciar una conmutación por error en la región de DR. Para implementar la detección automatizada y lograr un RTO alto, puede crear una solución basada en comprobaciones de estado. Estas comprobaciones de estado no se limitan al control de funcionamiento (que comprueban si los módulos del plano de control y del plano de datos de una red pueden comunicarse entre sí), sino que profundizan para evaluar la naturaleza interrelacionada de los componentes de la aplicación a fin de lograr una predicción precisa. Sin embargo, una solución automatizada puede conllevar el riesgo de falsas alarmas, lo que puede provocar conmutaciones por error innecesarias. Debe tener cuidado en este caso, ya que las conmutaciones por error innecesarias causan problemas de disponibilidad para su empresa. También puede crear anulaciones manuales en el flujo de trabajo para confirmar que se realizó la conmutación por error. Puede suscribirse a las notificaciones RSS del Panel de estado del servicio para mantenerse informado de las interrupciones en el nivel de servicio. Además, puedes usar AWS Health Dashboard(requiere una AWS cuenta) dentro de tu región principal y tu cuenta para estar al tanto de los eventos que pueden afectar a tu cuenta. Así podrá tomar una decisión informada sobre la conmutación por error en caso de que se produzca un evento en toda la región.

Conmutación por error

Independientemente de la estrategia de DR que elija, puede crear soluciones de automatización de DR personalizadas para realizar la conmutación por error en la región de DR. Con esta automatización, se puede minimizar la necesidad de intervención manual y lograr un mayor control a la hora de probar su solución de DR. Puede elegir entre el AWS servicio APIs, que se AWS proporciona en varios idiomas JavaScript, como Python, PHP, .NET, Ruby, Java, Go, Node.js y C++, según las preferencias de su organización. Para crear una automatización que utilice estos AWS servicios APIs, primero debe centrarse en convertir la infraestructura de la base de datos en código en forma de plantillas de AWS CloudFormation Terraform. Mediante estas plantillas, puede automatizar la conmutación por error de varias bases de datos y también mantener el orden en que los componentes de la aplicación y la base de datos se vuelven a instalar en la región de DR.

Para fines de DR, le recomendamos que se centre en estos dos objetivos:

  • Las CloudFormation pilas existentes deben exportar la información pertinente sobre sus bases de datos, incluidos los nombres de las instancias y los puntos finales. Sus procesos de automatización pueden hacer referencia a estos valores de exportación dentro de una región y realizar operaciones que lo ayuden en sus operaciones de recuperación de desastres.

  • Si tienes recursos que están en producción pero no tienes una CloudFormation pila asociada, deberías centrarte en crear pilas para esos recursos. Asegúrese también de que estas pilas abarquen los valores de exportación correctos, como se mencionó en el punto anterior.

Cuando haya alcanzado estos dos objetivos, podrá crear soluciones de automatización en el idioma que prefiera su organización para aprovechar las CloudFormation exportaciones y realizar automáticamente las acciones transitorias necesarias en caso de desastre. Por ejemplo, si tiene un almacén de datos global ElastiCache (Redis OSS) que se implementa como CloudFormation plantilla, el código de automatización tiene acceso a CloudFormation las exportaciones que proporcionan detalles sobre el almacén de datos global. En caso de desastre, el código puede convertir automáticamente el almacén de datos secundario en almacén de datos principal sin ninguna intervención manual mediante el servicio (Redis OSS). ElastiCache APIs

En un escenario típico, la automatización debe ser escalable para varias bases de datos de la organización. Puede escalar sus soluciones de automatización para varias bases de datos mediante AWS Step Functions o AWS Batch.