Escenarios de recuperación de desastres - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Escenarios de recuperación de desastres

En esta sección se proporcionan ejemplos de errores en una sola zona o AWS región de disponibilidad y se analizan las opciones de recuperación ante desastres (DR). Los ejemplos suponen un objetivo de punto de recuperación (RPO) de 15 minutos y un objetivo de tiempo de recuperación (RTO) de 4 horas.

Un error de zona de disponibilidad

Puede usar una de las siguientes opciones para recuperarse de un error en una sola zona de disponibilidad dentro de los parámetros indicados (RPO de 15 minutos, RTO de 4 horas).

  • Aprovisione la recuperación de la aplicación mediante la copia de seguridad de imágenes más reciente de Amazon Elastic Compute Cloud (Amazon EC2) y conéctese a la instancia de base de datos en espera activa existente mediante el despliegue de un grupo de disponibilidad Always On o el envío de registros.

    • La configuración de un grupo de disponibilidad Always On de SQL Server para recuperación ante desastres con dos o más nodos ofrece una conmutación por error automática al nodo secundario mediante el modo de confirmación síncrona o asíncrona, por lo que la base de datos está disponible de forma inmediata. En una configuración de alta disponibilidad, ambos nodos están disponibles para las operaciones de lectura. Esta opción cumple cómodamente con los requisitos de RTO y RPO. En la edición SQL Server Standard, el uso de grupos de disponibilidad básicos también es una opción, pero está limitado a dos nodos, ya que un grupo de disponibilidad solo puede incluir una base de datos. Sin embargo, puede configurar varios grupos de disponibilidad dentro de una región o entre regiones. Esta configuración permite ahorrar costos, ya que no supone ningún costo adicional para el nodo secundario, al que no se puede acceder para las operaciones de lectura. La edición SQL Server Enterprise proporciona funcionalidad completa y conmutación por error para todas las bases de datos de un único grupo de disponibilidad. Para ver ejemplos de esta opción, consulte los siguientes diagramas de arquitectura:

    • El envío de registros de SQL Server como solución de recuperación ante desastres requiere una conmutación por error manual a un servidor en espera y depende de la frecuencia de las copias de seguridad de los registros. Esta es una de las opciones de recuperación ante desastres menos costosas. No es necesario que las ediciones de SQL Server para el sitio de DR principal y las que se envían por registro coincidan. Esta opción cumple con el RPO (se utilizan copias de seguridad del registro de transacciones cada 5 minutos) y el RTO, pero requiere mantenimiento mediante scripts manuales y personalizados. Para ver un ejemplo de esta opción, consulte el siguiente diagrama de arquitectura:

  • Si tiene una aplicación, como una aplicación de SQL Server Reporting Services (SSRS), que tiene una implementación de escalada horizontal, el equilibrador de carga puede redirigir todo el tráfico al nodo secundario.

  • Puede utilizar Amazon EC2 Base AMIs como servidor de aplicaciones y bases de datos para aprovisionar la infraestructura. Las bases de datos pueden restaurarse en una nueva Zona de disponibilidad, en función de su tamaño y de la frecuencia de las copias de seguridad, a partir de las copias de seguridad nativas más recientes (copia de seguridad completa, copia de seguridad diferencial o copias de seguridad del registro de transacciones cada 5 minutos) o utilizando instantáneas de EBS. Esta opción cumple con los requisitos de RPO y RTO, pero requiere secuencias de comandos personalizadas. También debe tener en cuenta el tiempo necesario para aprovisionar la infraestructura, y cumplir con los requisitos de RPO y RTO puede resultar difícil.

  • EC2 Las imágenes de Amazon (incluidos los volúmenes de EBS) tanto para las aplicaciones como para el servidor de bases de datos se pueden restaurar en una nueva zona de disponibilidad. El RPO puede resultar complicado, en función de la copia de seguridad más reciente, pero esta opción se puede combinar con los registros de transacciones más recientes para cumplir con los requisitos. Esta opción es compatible con copias instantáneas de Windows Volume Shadow Copy Service (VSS).

Un error de región

Puede utilizar una de las siguientes opciones para recuperarse de un error en una sola AWS región dentro de los parámetros indicados (RPO de 15 minutos, RTO de 4 horas).

  • Puede utilizar Amazon Machine Images (AMIs) EC2 basado en Amazon como servidor de aplicaciones y bases de datos para aprovisionar la infraestructura. Las bases de datos se pueden restaurar en una nueva región, según su tamaño y frecuencia de copia de seguridad, a partir de las copias de seguridad nativas más recientes (copias de seguridad completas, copias de seguridad diferenciales o copias de seguridad del registro de transacciones cada 5 minutos). Esta opción cumple con los requisitos de RPO y RTO, pero requiere secuencias de comandos personalizadas.

    • El envío de registros de SQL Server como solución de recuperación ante desastres requiere una conmutación por error manual a un servidor en espera y depende de la frecuencia de las copias de seguridad de los registros. Esta es una de las opciones de recuperación ante desastres menos costosas. No es necesario que las ediciones de SQL Server para el sitio de DR principal y las que se envían por registro coincidan. Esta opción cumple con el RPO (mediante el uso de copias de seguridad del registro de transacciones cada 5 minutos) y el RTO, pero requiere mantenimiento mediante scripts manuales y personalizados. Las bases de datos grandes requieren tiempos de restauración prolongados.

  • Puede utilizar una Amazon EC2 AMI tanto para la aplicación como para el servidor de base de datos y restaurarla en un destino de una nueva región. El RPO depende del tamaño y la frecuencia de las copias de seguridad.

    • Las imágenes de aplicación más recientes se pueden restaurar mediante una AMI. Puede utilizar copias de seguridad nativas recientes de los registros diferenciales o de transacciones cada 5 minutos para actualizar la base de datos y cumplir con el RPO.

    • El RTO depende del tamaño y del tiempo necesario para transferir y restaurar las instantáneas a la nueva región, si la fuente aún no está sincronizada con el destino.

  • La solución con el menor tiempo de inactividad es restaurar la imagen de copia de seguridad de la aplicación y tener un nodo SQL Server en espera caliente en una región remota utilizando una configuración de grupo de disponibilidad de dos, tres o cuatro nodos (básica, clásica o distribuida) y conectarse al servidor de base de datos en espera después de una conmutación por error. La réplica en modo síncrono-compromiso cumple los requisitos de RPO, mientras que la réplica en modo asíncrono-compromiso podría retrasarse en función del volumen de transacciones. Si es necesario, puede usar una configuración de grupo de disponibilidad distribuida para escalar los nodos de la base de datos en una nueva región. Esta configuración también reduce la complejidad, ya que utiliza dos grupos de disponibilidad independientes en lugar de un único grupo de disponibilidad repartido por Regiones en modo síncrono-compromiso o asíncrono-compromiso, y cumple cómodamente los requisitos de RTO y RPO. Como alternativa, también es posible utilizar los grupos de disponibilidad básicos de SQL Server en la edición Standard. Sin embargo, tiene limitaciones porque solo admite hasta dos nodos y solo una base de datos puede estar en un solo grupo de disponibilidad, aunque se admiten varios grupos de disponibilidad. Puede configurar la edición SQL Server Standard en una región o en varias regiones. Esta edición ofrece ahorros de costos porque no cobra por el nodo secundario, al que no se puede acceder para las operaciones de lectura. La edición SQL Server Enterprise proporciona una funcionalidad completa y admite la conmutación por error de todas las bases de datos como una conmutación por error de un solo grupo de disponibilidad.

Casos de uso comunes

Como ejercicio de dimensionamiento, el 80% de las aplicaciones de SQL Server que se ejecutan en Amazon y EC2 que tienen una carga de trabajo normal de procesamiento de transacciones en línea (OLTP) se pueden agrupar en una de estas tres categorías en función de su importancia:

  • SQL Server HA/DR con copias de seguridad de SQL Server, que utilizan dos réplicas de confirmación sincrónica y una réplica en modo de confirmación asíncrona

  • AWS Backup HA/DR con copias de seguridad de SQL Server, mediante una EC2 AMI de Amazon para la aplicación y la base de datos, y almacenamiento de Amazon EBS

  • AWS Backup HA/DR con copias de seguridad de SQL Server, mediante una EC2 AMI base de Amazon para el servidor de bases de datos, una EC2 imagen de Amazon para la aplicación e instantáneas de Amazon EBS

En la siguiente tabla se proporcionan detalles sobre cada categoría.

  SQL Server HA/ DR con copias de seguridad de SQL Server AWS Backup HA/DR con almacenamiento de EBS y copias de AMIs seguridad de SQL Server AWS Backup HA/DR con instantáneas de EBS AMIs y copias de seguridad de SQL Server

Restaure el proceso en caso de desastre

  • Restaure EC2 la AMI base de Amazon para la aplicación desde AWS Backup

  • Conmute por error a la instancia en espera de la región (en caso de que se produzca un error en la zona de disponibilidad) o a la instancia entre regiones (en caso de que se produzca un error en la región)

  • Cumple con los requisitos de RPO y RTO

  • Restaure EC2 imágenes de Amazon a partir de copias de seguridad tanto de la aplicación como de la base de datos

  • Ofrece soporte dentro y fuera de la región

  • Aplique las copias de seguridad más recientes del registro diferencial y de transacciones de SQL Server (cada 15 minutos) para cumplir con los requisitos de RPO y RTO de la base de datos

  • Restaure EC2 la imagen de Amazon desde la copia de seguridad de la aplicación

  • Restaure EC2 la AMI base de Amazon para el servidor de bases de datos

  • Restaure las instantáneas de EBS (si las hubiera)

  • El clúster debe reconstruirse

  • Ofrece soporte dentro y fuera de la región

  • Aplique las copias de seguridad más recientes del registro diferencial y de transacciones a la base de datos para cumplir con los requisitos de RPO, pero es posible que no se cumpla con el RTO

Recursos principales

  • Tres licencias de la edición SQL Server Enterprise (la licencia pasiva de nodos HA y DR es gratuita si tiene un acuerdo de licencia de Software Assurance vigente con Microsoft; consulte el anuncio)

  • Espacio EC2 de respaldo de Amazon en Amazon Simple Storage Service (Amazon S3)

  • Transferencia de datos entre regiones

  • Una licencia de SQL Server (cualquier edición).

  • Espacio EC2 de respaldo de Amazon en Amazon S3

  • Copias de seguridad de SQL Server (archivos diferenciales y de registro) en Amazon S3

  • Transferencia de datos entre regiones

  • Una licencia de SQL Server (cualquier edición).

  • Espacio EC2 de respaldo de Amazon en Amazon S3

  • Copias de seguridad de SQL Server (archivos diferenciales y de registro) en Amazon S3

  • Transferencia de datos entre regiones

HA/DR

Ofrece HA y DR

Ofrece DR únicamente

Ofrece DR únicamente

RPO

La conmutación por error la gestiona el grupo de disponibilidad de SQL Server (la DR es manual)

Con guion manual o personalizado

Con guion manual o personalizado

RTO

Segundos a minutos

Minutos a horas

Múltiples horas

Riesgo de pérdida SLAs

Bajo

Medio

Alto

Capacidad de administración

Sencillez

Medio

Medio

Escalado

Sencillez

Medio

Medio

Limitaciones de tamaño de archivo para cargas a Amazon S3 o transferencias entre regiones

N/A: se maneja en modo de confirmación sincrónica o asíncrona a un modo de espera caliente

Pérdida de datos

Casi cero (depende de la carga de trabajo y de la infraestructura aprovisionadas)

Depende de la frecuencia de las imágenes de EC2 backup de Amazon y de las copias de seguridad de SQL Server

Depende de la frecuencia de las imágenes de EC2 backup de Amazon o de las instantáneas de EBS y de las copias de seguridad de SQL Server

Costo

Medio

Medio - bajo

Medio - bajo