Recuperación ante desastres y clústeres globales de Amazon DocumentDB - Amazon DocumentDB

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Recuperación ante desastres y clústeres globales de Amazon DocumentDB

Al utilizar un clúster global, puede recuperarse rápidamente de desastres como errores de región. La recuperación tras un desastre se mide normalmente con los valores de RTO yRPO.

  • Objetivo de tiempo de recuperación (RTO): el tiempo que tarda un sistema en volver a funcionar después de un desastre. En otras palabras, RTO mide el tiempo de inactividad. Para un clúster global, RTO en minutos.

  • Objetivo del punto de recuperación (RPO): la cantidad de datos que se pueden perder (medida en el tiempo). En el caso de un clúster global, normalmente RPO se mide en segundos.

  • Para recuperarse de una interrupción imprevista, puede realizar una conmutación por error entre regiones en uno de los secundarios de su clúster global. Si su clúster global tiene varias regiones secundarias, asegúrese de separar todas las regiones secundarias que desee promover como principales. Después, promocione una de esas regiones secundarias para que sea la nueva Región de AWS principal. Por último, creará nuevos clústeres en cada una de las demás regiones secundarias y adjuntará esos clústeres a su clúster global.

Realizar una conmutación por error gestionada para un clúster global de Amazon DocumentDB

Este enfoque tiene por objeto garantizar la continuidad empresarial en caso de que se produzca un verdadero desastre regional o una interrupción total del nivel de servicio.

Durante una conmutación por error gestionada, el clúster principal se conmuta por error a la región secundaria que elija mientras se mantiene la topología de replicación existente del clúster global de Amazon DocumentDB. El clúster secundario elegido promueve uno de sus nodos de solo de lectura al estado de escritor completo. Este paso permite que el clúster asuma el rol de clúster principal. La base de datos no estará disponible durante un breve periodo, mientras el clúster asume su nuevo rol. Es posible que falten datos que no se hayan replicado del clúster principal anterior al secundario elegido cuando este clúster secundario pase a ser el nuevo principal. El volumen principal anterior hace todo lo posible por tomar una instantánea antes de sincronizarla con el nuevo volumen principal, de modo que los datos no replicados se conserven en la instantánea.

nota

Solo puede realizar una conmutación por error gestionada entre regiones en un clúster global de Amazon DocumentDB si los clústeres principal y secundario tienen las mismas versiones de motor principal, secundaria y a nivel de parche. Sin embargo, los niveles de revisión pueden ser diferentes en función de la versión secundaria del motor. Si las versiones del motor no son compatibles, puede realizar la conmutación por error manualmente por medio de los pasos que se indican en Realizar una conmutación por error manual para un clúster global de Amazon DocumentDB.

Para minimizar la pérdida de datos, le recomendamos que haga lo siguiente antes de utilizar esta característica:

  • Desconecte las aplicaciones para evitar que las escrituras se envíen al clúster principal del clúster global de Amazon DocumentDB.

  • Compruebe los tiempos de retraso de todos los clústeres secundarios de Amazon DocumentDB. La elección de la región secundaria con el menor retraso de replicación puede minimizar la pérdida de datos con respecto a la región principal que actualmente presenta errores. Compruebe los tiempos de retraso de todos los clústeres secundarios de Amazon DocumentDB del clúster global consultando la GlobalClusterReplicationLag métrica en Amazon. CloudWatch Estas métricas muestran el retraso (en milisegundos) de la replicación en un clúster secundario con respecto al clúster principal.

    Para obtener más información sobre CloudWatch las métricas de Amazon DocumentDB, consulte. Métricas de Amazon DocumentDB

Durante una conmutación por error gestionada, el clúster secundario elegido pasa a ocupar su nueva función de principal. Sin embargo, no hereda las distintas opciones de configuración del clúster principal. Una falta de coincidencia en la configuración puede provocar problemas de rendimiento, incompatibilidades de carga de trabajo y otros comportamientos anómalos. Para evitar estos problemas, le recomendamos que resuelva las diferencias entre sus clústeres globales de Amazon DocumentDB en relación con lo siguiente:

  • Configure un grupo de parámetros de clúster de Amazon DocumentDB para el nuevo clúster principal, si es necesario: puede configurar los grupos de parámetros de clúster de Amazon DocumentDB de forma independiente para cada clúster de sus clústeres globales de Amazon DocumentDB. Por lo tanto, al promover un clúster secundario para que asuma la función principal, es posible que el grupo de parámetros del secundario se configure de forma diferente que el del principal. Si es así, modifique el grupo de parámetros del clúster secundario promocionado para que se ajuste a la configuración del clúster principal. Para saber cómo hacerlo, consulte Modificación de grupos de parámetros de clúster de Amazon DocumentDB.

  • Configure las herramientas y opciones de monitoreo, como CloudWatch los eventos y las alarmas de Amazon: configure el clúster promocionado con la misma capacidad de registro, alarmas, etc., según sea necesario para el clúster global. Al igual que con los grupos de parámetros, la configuración de estas características no se hereda del clúster principal durante el proceso de conmutación por error. Algunas CloudWatch métricas, como el retraso en la replicación, solo están disponibles para las regiones secundarias. Por lo tanto, una conmutación por error cambia la forma de ver esas métricas y configurar las alarmas en ellas, y podría requerir cambios en los paneles predefinidos. Para obtener más información sobre los clústeres y la supervisión de Amazon DocumentDB, consulte. Monitorización de Amazon DocumentDB

Por lo general, el clúster secundario elegido asume el rol principal en cuestión de minutos. En cuanto el nodo de escritor de la nueva región principal esté disponible, podrá conectar sus aplicaciones a él y reanudar sus cargas de trabajo. Una vez que Amazon DocumentDB promocione el nuevo clúster principal, reconstruirá automáticamente todos los clústeres regionales secundarios adicionales.

Dado que los clústeres globales de Amazon DocumentDB utilizan la replicación asíncrona, el retraso de la replicación en cada región secundaria puede variar. Amazon DocumentDB reconstruye estas regiones secundarias para que tengan exactamente los mismos point-in-time datos que el nuevo clúster de regiones principal. La duración de la tarea de reconstrucción completa puede tardar entre unos minutos y varias horas, según el tamaño del volumen de almacenamiento y la distancia entre las regiones. Cuando los clústeres de la región secundaria terminen de reconstruirse a partir de la nueva región principal, estarán disponibles para el acceso de lectura. En cuanto se promocione y esté disponible el nuevo redactor principal, el clúster de la nueva región principal podrá gestionar las operaciones de lectura y escritura del clúster global de Amazon DocumentDB.

Para restaurar la topología original del clúster global, Amazon DocumentDB supervisa la disponibilidad de la antigua región principal. Tan pronto como la región esté en buen estado y vuelva a estar disponible, Amazon DocumentDB la volverá a añadir automáticamente al clúster global como región secundaria. Antes de crear el nuevo volumen de almacenamiento en la antigua región principal, Amazon DocumentDB intenta tomar una instantánea del volumen de almacenamiento anterior en el momento en que se produce el error. Lo hace para que pueda usarla para recuperar cualquiera de los datos perdidos. Si la operación se realiza correctamente, Amazon DocumentDB coloca esta instantánea denominada «rds: docdb-unplanned-global-failover - name-of-old-primary -DB-Cluster-Timestamp» en la sección de instantáneas del. AWS Management Console También puede ver esta instantánea en la información devuelta por la operación. DescribeDBClusterSnapshots API

nota

La instantánea del volumen de almacenamiento anterior es una instantánea del sistema que está sujeta al período de retención de la copia de seguridad configurado en el clúster principal anterior. Para conservar esta instantánea más allá del período de retención, puede copiarla para guardarla como una instantánea manual. Para obtener más información sobre la copia de instantáneas, incluido el precio, consulte Copiar una instantánea del clúster.

Una vez restaurada la topología original, puede devolver el clúster global a la región principal original realizando una operación de conmutación cuando sea más conveniente para su empresa y su carga de trabajo. Para ello, siga los pasos que se indican en Realizar un cambio a un clúster global de Amazon DocumentDB.

Puede realizar una conmutación por error de su clúster global de Amazon DocumentDB mediante Amazon DocumentDB o Amazon DocumentDB. AWS Management Console AWS CLI API

Using the AWS Management Console

Para realizar la conmutación por error gestionada en su clúster global de Amazon DocumentDB

  1. Inicie sesión en y abra la AWS Management Console consola de Amazon DocumentDB en https://console.aws.amazon.com /docdb.

  2. En el panel de navegación, seleccione Clusters (Clústeres).

  3. Busque y elija el clúster global de Amazon DocumentDB al que desee realizar la conmutación por error.

    Imagen: tabla de clústeres con el clúster global seleccionado.
  4. Seleccione Conmutación o Conmutación por error en el menú Acciones.

  5. En el cuadro de diálogo que aparece, seleccione Conmutación por error y, a continuación, elija el clúster secundario en la lista desplegable del nuevo campo de clúster principal.

    Imagen: cuadro de diálogo de conmutación por error o conmutación por error de clúster global.
  6. Escriba «confirmar» en el último campo. A continuación, seleccione Confirm (Confirmar).

    El estado del clúster principal cambia a «Conmutación por error». Esta condición debería tardar aproximadamente un minuto. Durante este tiempo, el estado del nuevo clúster principal muestra «Modificando... ». Una vez que se promocione la nueva primaria, aparecerá como «Disponible» y podrá procesar transacciones de lectura y escritura. Las regiones secundarias, incluida la antigua principal, mostrarán el mensaje «Resincronización... «mientras se vuelve a sincronizar con el nuevo primario. Al igual que el nuevo sistema principal, solo podrá procesar transacciones una vez que su estado cambie a «Disponible».

  7. Cuando se complete, el clúster principal original se convierte en el clúster secundario. El clúster secundario seleccionado se convierte en el clúster principal.

    Imagen: tabla de clústeres que muestra el nuevo clúster principal.
Using the AWS CLI

Para realizar la conmutación por error gestionada en su clúster global de Amazon DocumentDB

Utilice el failover-global-cluster CLI comando para realizar una conmutación por error del clúster global de Amazon DocumentDB. Con el comando, pase los valores de los siguientes parámetros:

  • --region— Especifique Regiones de AWS dónde se ejecuta el clúster principal del clúster global de Amazon DocumentDB.

  • --global-cluster-identifier— Especifique el nombre del clúster global de Amazon DocumentDB.

  • --target-db-cluster-identifier— Especifique el nombre del recurso de Amazon (ARN) del clúster secundario de Amazon DocumentDB que desea promover para que sea el principal del clúster global de Amazon DocumentDB.

  • --allow-data-loss— Haga que se trate de una operación de conmutación por error de forma explícita en lugar de una operación de conmutación. Una operación de conmutación por error puede tener como resultado la pérdida de algunos datos si los componentes de replicación asincrónica no han completado el envío de todos los datos replicados a la región secundaria.

Para Linux, macOS o Unix:

aws docdb --region region_of_selected_secondary \ failover-global-cluster --global-cluster-identifier global_cluster_id \ --target-db-cluster-identifier arn_of_secondary_to_promote \ --allow-data-loss

Para Windows:

aws docdb --region region_of_selected_secondary ^ failover-global-cluster --global-cluster-identifier global_cluster_id ^ --target-db-cluster-identifier arn_of_secondary_to_promote ^ --allow-data-loss

Realizar una conmutación por error manual para un clúster global de Amazon DocumentDB

Si un clúster completo de uno de ellos Región de AWS deja de estar disponible, puede promover otro clúster del clúster global para que tenga capacidad de lectura y escritura.

Puede activar manualmente el mecanismo de conmutación por error del clúster global si un clúster de un clúster diferente Región de AWS es una mejor opción para ser el clúster principal. Por ejemplo, puede aumentar la capacidad de uno de esos clústeres secundarios y promoverlo para que sea el clúster principal. O bien, el equilibrio de la actividad entre ellos Regiones de AWS podría cambiar, por lo que cambiar el clúster principal a otro Región de AWS podría reducir la latencia de las operaciones de escritura.

El siguiente procedimiento describe qué hacer para promover uno de los clústeres secundarios de un clúster global de Amazon DocumentDB.

Para promover un clúster secundario:

  1. Deje de emitir DML sentencias y otras operaciones de escritura en el clúster principal durante Región de AWS la interrupción.

  2. Identifique un clúster de un secundario Región de AWS para usarlo como un nuevo clúster principal. Si tiene dos (o más) secundarios Regiones de AWS en su clúster global, elija el clúster secundario que tenga el menor tiempo de retraso.

  3. Desconecte el clúster secundario del clúster global elegido.

    Al eliminar un clúster secundario de un clúster global, se detiene inmediatamente la replicación del clúster principal a este secundario y se convierte en un clúster aprovisionado independiente con capacidades completas de lectura y escritura. Todavía está disponible cualquier otro clúster secundario asociado con el clúster primario de la región con la interrupción y puede aceptar llamadas desde la aplicación. También consumen recursos. Dado que está recreando el clúster global, para evitar problemas de split-brain y otros problemas, elimine los otros clústeres secundarios antes de crear el nuevo clúster en los pasos que se indican a continuación.

    Para obtener más información sobre los pasos para desasociar clústeres, consulte Eliminación de un clúster global de Amazon DocumentDB.

  4. Este clúster se convierte en el clúster primario de un nuevo clúster global cuando comienza a agregarle regiones, en el siguiente paso.

  5. Añada un elemento al clúster Región de AWS . Al hacerlo, comienza el proceso de reproducción de clúster principal a secundario.

  6. Agregue más Regiones de AWS según sea necesario para volver a crear la topología necesaria para respaldar su aplicación. Asegúrese de que las escrituras de la aplicación se envían al clúster correcto antes, durante y después de realizar cambios como estos, para evitar incoherencias de datos entre los clústeres en el clúster global (problemas de split-brain).

  7. Cuando se haya resuelto la interrupción y esté listo para asignar su Región de AWS original como clúster primario de nuevo, realice los mismos pasos en orden inverso.

  8. Elimine uno de los clústeres secundarios del clúster global. Esto le permitirá atender el tráfico de lectura/escritura.

  9. Redirija todo el tráfico de escritura del clúster primario en la Región de AWS original.

  10. Añada un Región de AWS para configurar uno o más clústeres secundarios de la Región de AWS misma forma que antes.

Los clústeres globales de Amazon DocumentDB se pueden administrar mediante AWS SDKs, lo que le permite crear soluciones para automatizar el proceso de conmutación por error de clústeres globales para casos de uso de recuperación ante desastres y planificación de la continuidad empresarial. Una de estas soluciones está disponible para nuestros clientes con las licencias de Apache 2.0 y se puede acceder a ella desde nuestro repositorio de herramientas aquí. Esta solución aprovecha Amazon Route 53 para la administración de puntos finales y proporciona AWS Lambda funciones que se pueden activar en función de los eventos apropiados.

Realizar un cambio a un clúster global de Amazon DocumentDB

Al utilizar las transiciones, puede cambiar la región del clúster principal de forma rutinaria. Este enfoque está destinado a situaciones controladas, como el mantenimiento operativo y otros procedimientos operativos planificados.

Existen tres casos de uso comunes para utilizar las conmutaciones:

  • Para los requisitos de “rotación regional” impuestos a sectores específicos. Por ejemplo, es posible que los reglamentos de los servicios financieros exijan que los sistemas de nivel 0 se cambien a una región diferente durante varios meses para garantizar que los procedimientos de recuperación de desastres se ensayen con cierta asiduidad.

  • Para aplicaciones «» follow-the-sun multirregionales. Por ejemplo, es posible que una empresa desee ofrecer escrituras con menor latencia en diferentes regiones en función del horario laboral en distintas zonas horarias.

  • Como zero-data-loss método para volver a la región principal original tras una conmutación por error.

nota

Los cambios están diseñados para usarse en un clúster global de Amazon DocumentDB en buen estado. Para recuperarse de una interrupción imprevista, siga el procedimiento correspondiente en Realizar una conmutación por error manual para un clúster global de Amazon DocumentDB.

Para realizar una transición, el clúster de bases de datos secundario de destino debe ejecutar la misma versión del motor que el principal, incluido el nivel de parche, en función de la versión del motor. Para obtener más información, consulte Compatibilidad a nivel de parche para conmutaciones y conmutaciones por error gestionadas entre regiones. Antes de iniciar la transición, compruebe las versiones del motor de su clúster global para asegurarse de que admiten la transición entre regiones administrada y actualícelas, si es necesario. Amazon DocumentDB bloqueará automáticamente las llamadas al clúster de conmutación si las versiones del motor no coinciden.

Durante una transición, Amazon DocumentDB cambia el clúster principal a la región secundaria elegida, a la vez que mantiene la topología de replicación existente del clúster global. Antes de iniciar el proceso de cambio, Amazon DocumentDB espera a que todos los clústeres de regiones secundarias estén completamente sincronizados con el clúster de región principal. A continuación, el clúster de bases de datos de la región principal se convierte en un clúster de solo lectura y el clúster secundario que elija promueve uno de sus nodos de solo lectura a estado de escritor completo. Al convertir este nodo en escritor, el clúster secundario puede asumir el rol de clúster principal. Como todos los clústeres secundarios se sincronizaron con el principal al principio del proceso, el nuevo clúster principal continúa las operaciones del clúster global de Amazon DocumentDB sin perder ningún dato. La base de datos no estará disponible durante un breve periodo, mientras los clústeres principales y secundarios seleccionados asumen nuevas funciones.

Para optimizar la disponibilidad de las aplicaciones, se recomienda hacer lo siguiente antes de utilizar esta característica:

  • Realice esta operación durante las horas de menor actividad o en otro momento en el que las escrituras en el clúster principal sean mínimas.

  • Desconecte las aplicaciones para evitar que las escrituras se envíen al clúster principal del clúster global de Amazon DocumentDB.

  • Compruebe los tiempos de retraso de todos los clústeres secundarios de Amazon DocumentDB del clúster global consultando la GlobalClusterReplicationLag métrica en Amazon. CloudWatch Esta métrica muestra el retraso (en milisegundos) de la replicación en un clúster secundario con respecto al clúster principal. Este valor es directamente proporcional al tiempo que tarda Amazon DocumentDB en completar la transición. Por lo tanto, cuanto mayor sea el valor de retraso, más tiempo llevará la transición.

    Para obtener más información sobre CloudWatch las métricas de Amazon DocumentDB, consulte. Métricas de Amazon DocumentDB

Durante una transición, el clúster secundario de base de datos elegido se promueve a su nuevo rol de clúster principal. Sin embargo, no hereda las diversas opciones de configuración del clúster principal de base de datos. Una falta de coincidencia en la configuración puede provocar problemas de rendimiento, incompatibilidades de carga de trabajo y otros comportamientos anómalos. Para evitar estos problemas, le recomendamos que resuelva las diferencias entre sus clústeres globales de Amazon DocumentDB en relación con lo siguiente:

  • Configure el grupo de parámetros del clúster de base de datos de Amazon DocumentDB para el nuevo clúster principal, si es necesario: puede configurar los grupos de parámetros del clúster de Amazon DocumentDB de forma independiente para cada clúster del clúster global de Amazon DocumentDB. Esto significa que cuando se promueve un clúster secundario de base de datos para asumir el rol principal, su grupo de parámetros puede configurarse de manera diferente que para el principal. Si es así, modifique el grupo de parámetros del clúster secundario de base de datos promocionado para que se ajuste a la configuración del clúster principal. Para saber cómo hacerlo, consulte Administración de los grupos de parámetros de clúster de Amazon DocumentDB.

  • Configure las herramientas y opciones de monitoreo, como Amazon CloudWatch Events y las alarmas: configure el clúster promocionado con la misma capacidad de registro, alarmas, etc., según sea necesario para el clúster global. Al igual que con los grupos de parámetros, la configuración de estas características no se hereda del clúster principal durante el proceso de transición. Algunas CloudWatch métricas, como el retraso en la replicación, solo están disponibles para las regiones principales. Por lo tanto, una transición cambia la forma de ver esas métricas y configurar las alarmas en ellas, y podría requerir cambios en los paneles predefinidos. Para obtener más información, consulte Monitorización de Amazon DocumentDB.

nota

Por lo general, la transición de rol puede tardar varios minutos.

Cuando se complete el proceso de cambio, el clúster promocionado de Amazon DocumentDB podrá gestionar las operaciones de escritura del clúster global.

Puede cambiar su clúster global de Amazon DocumentDB mediante AWS Management Console o: AWS CLI

Using the AWS Management Console

Para realizar la conmutación en su clúster global de Amazon DocumentDB

  1. Inicie sesión en y abra la AWS Management Console consola de Amazon DocumentDB en https://console.aws.amazon.com /docdb.

  2. En el panel de navegación, seleccione Clusters (Clústeres).

  3. Busque y seleccione el clúster global de Amazon DocumentDB al que desee cambiar.

    Imagen: tabla de clústeres con el clúster global seleccionado.
  4. Seleccione Conmutación o Conmutación por error en el menú Acciones.

  5. En el cuadro de diálogo que aparece, elija Switchover y, a continuación, elija el clúster secundario en la lista desplegable del nuevo campo de clúster principal.

    Imagen: diálogo de cambio de clúster con el clúster secundario seleccionado.
  6. Elija Confirmar.

    El estado del clúster principal cambia a «Conmutación». Esta condición debería tardar aproximadamente tres minutos. Durante este tiempo, el estado de todos los clústeres regionales muestra «Modificando... ». Una vez que se sincronicen las regiones y se promueva la nueva principal, aparecerá el mensaje «Disponible» en todos los campos de estado y podrá procesar transacciones.

  7. Cuando se complete, el clúster principal original pasará a ser el clúster secundario. El clúster secundario seleccionado se convierte en el clúster principal.

    Imagen: tabla de clústeres que muestra el nuevo clúster principal.
Using the AWS CLI

Para realizar la conmutación en su clúster global de Amazon DocumentDB

Utilice el switchover-global-cluster CLI comando para cambiar el clúster global de Amazon DocumentDB. Con el comando, pase los valores de los siguientes parámetros:

  • --region— Especifique Regiones de AWS dónde se ejecuta el clúster principal del clúster global de Amazon DocumentDB.

  • --global-cluster-identifier— Especifique el nombre del clúster global de Amazon DocumentDB.

  • --target-db-cluster-identifier— Especifique el nombre del recurso de Amazon (ARN) del clúster secundario de Amazon DocumentDB que desea promover para que sea el principal del clúster global de Amazon DocumentDB.

Para Linux, macOS o Unix:

aws docdb --region region_of_primary \ switchover-global-cluster --global-cluster-identifier global_cluster_id \ --target-db-cluster-identifier arn_of_secondary_to_promote

Para Windows:

aws docdb --region region_of_primary ^ switchover-global-cluster --global-cluster-identifier global_cluster_id ^ --target-db-cluster-identifier arn_of_secondary_to_promote