Componentes de AWS DMS - AWS Database Migration Service

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Componentes de AWS DMS

En esta sección se describen los componentes internos de AWS DMS y cómo funcionan juntos para llevar a cabo su migración de datos. Comprender los componentes subyacentes de AWS DMS puede ayudarle a migrar datos de forma más eficiente y a proporcionar una mejor visión a la hora de solucionar problemas o de investigarlos.

UnaAWS DMS migración consta de cinco componentes: descubrimiento de las bases de datos que se van a migrar, conversión automática de esquemas, una instancia de replicación, puntos finales de origen y destino y una tarea de replicación. Para crear unaAWS DMS migración, cree la instancia de replicación, los puntos finales y las tareas necesarios en unRegión de AWS.

Detección de base de

DMS Fleet Advisor recopila datos de múltiples entornos de bases de datos para proporcionar información sobre su infraestructura de datos. DMS Fleet Advisor recopila datos de la base de datos local y de los servidores de análisis de una o más ubicaciones centrales sin necesidad de instalarlos en todos los ordenadores. Actualmente, DMS Fleet Advisor es compatible con los servidores de bases de datos Microsoft SQL Server, MySQL, Oracle y PostgreSQL.

En función de los datos detectados en su red, DMS Fleet Advisor crea un inventario que puede revisar para determinar qué servidores y objetos de bases de datos debe monitorear. A medida que se recopilen detalles sobre estos servidores, bases de datos y esquemas, podrá analizar la viabilidad de las migraciones de bases de datos previstas.

Migración de esquemas y códigos

La conversión de esquemas de DMSAWS DMS hace que las migraciones de bases de datos entre diferentes tipos de bases de datos sean más predecibles. Puede utilizar la conversión de esquemas de DMS para evaluar la complejidad de la migración para su proveedor de datos de origen y, a continuación, usarla para convertir esquemas de bases de datos y objetos de código. A continuación, puede aplicar el código convertido a la base de datos de destino.

A un nivel superior, DMS Schema Conversion funciona con los tres componentes siguientes: perfiles de instancia, proveedores de datos y proyectos de migración. Un perfil de instancia especifica la configuración de red y seguridad. Un proveedor de datos almacena las credenciales de conexión a la base de datos. Un proyecto de migración contiene proveedores de datos, un perfil de instancia y reglas de migración. AWS DMSutiliza proveedores de datos y un perfil de instancia para diseñar un proceso que convierta esquemas de bases de datos y objetos de código.

Instancia de replicación

A un nivel superior, una instancia deAWS DMS replicación es simplemente una instancia de Amazon Elastic Compute Cloud (Amazon EC2) administrada que aloja una o más tareas de replicación.

La figura siguiente muestra una instancia de replicación de ejemplo que ejecuta varias tareas de replicación asociadas.


                            Introducción a AWS DMS

Una sola instancia de replicación puede alojar una o varias tareas de replicación, en función de las características de su migración y la capacidad del servidor de replicación. AWS DMS proporciona una gran variedad de instancias de replicación, de modo que puede elegir la configuración óptima para su caso de uso. Para obtener más información acerca de las diversas clases de instancias de replicación, consulte Elegir la instancia de replicación deAWS DMS adecuada para la migración.

AWS DMScrea la instancia de replicación en una instancia Amazon EC2. Algunas de las clases de instancias más pequeñas son suficientes para probar el servicio o para pequeñas migraciones. Si su migración conlleva muchas tablas, o si va a ejecutar varias tareas de replicación simultáneas, debería plantearse el uso de una de las instancias más grandes. Le recomendamos este método porque AWS DMS puede consumir una cantidad significativa de memoria y de CPU.

Según la clase de instancia de Amazon EC2 que seleccione, la instancia de replicación incluye 50 GB o 100 GB de almacenamiento de datos. Esta cantidad suele ser suficiente para la mayoría de los clientes. Sin embargo, si la migración implica grandes transacciones o un alto volumen de cambios de datos, entonces es posible que desee aumentar la asignación de almacenamiento base. La captura de datos de cambio (CDC) puede provocar que los datos se escriban en el disco, en función de la rapidez con que el destino pueda escribir los cambios. Como los archivos de registro también se escriben en el disco, aumentar el nivel de gravedad del registro también conllevará un mayor consumo de almacenamiento.

AWS DMS puede proporcionar alta disponibilidad y soporte de conmutación por error mediante una implementación Multi-AZ. En una implementación Multi-AZ, AWS DMS aprovisiona y mantiene automáticamente una réplica en espera de la instancia de replicación en una zona de disponibilidad diferente. La instancia de replicación principal se replica sincrónicamente en la réplica en espera. Si la instancia de replicación principal falla o no responde, la instancia en espera reanuda cualquier tarea en ejecución con una interrupción mínima. Debido a que el nodo principal replica constantemente su estado a la espera, la implementación Multi-AZ incurre en algunos costos de desempeño.

Para obtener más información detallada acerca de la instancia de replicación de AWS DMS, consulte Trabajar con una instancia de replicación de AWS DMS.

Punto de conexión

AWS DMS utiliza un punto de enlace para obtener acceso a su almacén de datos de origen o de destino. La información de conexión específica es diferente, en función de su almacén de datos, pero en general proporcione la siguiente información al crear un punto de enlace:

  • Tipo de punto final: origen o destino.

  • Tipo de motor: tipo de motor de base de datos, como Oracle o PostgreSQL.

  • Nombre del servidor: nombre del servidor o dirección IP a la queAWS DMS se puede acceder.

  • Puerto: número de puerto utilizado para las conexiones al servidor de bases de datos.

  • Cifración: modo de Capa de conexión segura (SSL), si se usa SSL para cifrar la conexión.

  • Credenciales: nombre de usuario y contraseña de una cuenta con los derechos de acceso necesarios.

Al crear un punto de enlace con la consola de AWS DMS, la consola requiere que pruebe la conexión de punto de enlace. La prueba debe realizarse correctamente antes de utilizar el punto final en unaAWS DMS tarea. Al igual que la información de conexión, los criterios de prueba específicos son distintos para los distintos tipos de motor. En general, AWS DMS verifica que la base de datos existe en el nombre de servidor y puerto especificado y que las credenciales suministradas se pueden utilizar para conectarse a la base de datos con los privilegios necesarios para realizar una migración. Si la prueba de conexión se realiza correctamente, AWS DMS descarga y almacena la información del esquema para utilizarla más adelante durante la configuración de la tarea. La información de esquema puede incluir definiciones de tabla, definiciones de clave principal y definiciones de clave única, por ejemplo.

Más de una tarea de replicación puede utilizar un único punto de enlace. Por ejemplo, podría tener dos aplicaciones distintas lógicamente alojadas en la misma base de datos de origen que desea migrar por separado. En este caso, creará dos tareas de replicación, una para cada conjunto de tablas de aplicación. Puede usar el mismo punto de enlace de AWS DMS en ambas tareas.

Puede personalizar el comportamiento de un punto final mediante la configuración del punto final. La configuración de los endpoints puede controlar varios comportamientos, como los detalles del registro, el tamaño del archivo y otros parámetros. Cada tipo de motor de almacenamiento de datos tiene diferentes configuraciones de punto de conexión disponibles. Puede encontrar la configuración de punto final específica de cada banco de datos en la sección de origen o destino de ese banco de datos. Para obtener una lista de los almacenes de datos de origen y de destino admitidos, consulte Orígenes para AWS DMS y Destinos para AWS DMS.

Para obtener información detallada acerca de los puntos de enlace de AWS DMS, consulte Trabajando con terminales deAWS DMS.

Tareas de replicación

Se utiliza una tarea de replicación de AWS DMS para mover un conjunto de datos desde el punto de enlace de origen al punto de enlace de destino. La creación de una tarea de replicación es el último paso que debe realizar antes de iniciar una migración.

Cuando crea una tarea de replicación, puede especificar los siguientes ajustes de la tarea:

  • Instancia de replicación: la instancia para alojar y ejecutar la tarea

  • Punto de enlace de origen

  • Punto de enlace de destino

  • Opciones de tipo de migración, tal y como se indica a continuación. Para obtener una explicación completa de las opciones de tipos de migración, consulte Creación de una tarea.

    • Carga completa (migrar los datos existentes): si puedes permitirte una interrupción lo suficiente como para copiar tus datos existentes, esta es una buena opción para elegir. Esta opción simplemente migra los datos de la base de datos de origen a la de destino y crea tablas cuando es necesario.

    • Carga completa + CDC (migrar los datos existentes y replicar los cambios en curso): esta opción realiza una carga de datos completa a la vez que captura los cambios en la fuente. Una vez terminada la carga completa, los cambios capturados se aplican al destino. En el tiempo debido, la aplicación de los cambios alcanzará un estado de estabilidad. En ese momento, puede cerrar las aplicaciones, dejar que los cambios restantes fluyan al destino y reiniciar después las aplicaciones que apunten al destino.

    • Solo CDC (solo cambios en la replicación de datos): en algunas situaciones, puede ser más eficaz copiar los datos existentes mediante un método distinto alAWS DMS. En una migración homogénea, por ejemplo, usar herramientas nativas de exportación e importación puede ser más eficaz para cargar datos masivos. En este caso, puede utilizar AWS DMS para replicar cambios desde el momento en el que se inicia la carga masiva para que las bases de datos de origen y de destino se sincronicen y sigan sincronizadas.

  • Opciones de modo de preparación de tabla de destino, tal y como se indica a continuación. Para obtener una explicación completa de los modos de tabla de destino, consulte Creación de una tarea.

    • No hacer nada: seAWS DMS supone que las tablas de destino se crearon previamente en el destino.

    • Colocar tablas en el objetivo:AWS DMS elimina y vuelve a crear las tablas de destino.

    • Truncar: si ha creado tablas en el destino,AWS DMS las trunca antes de que comience la migración. Si no existen tablas y selecciona esta opción, AWS DMS crea las tablas que faltan.

  • Opciones de modo LOB, tal y como se indica a continuación. Para obtener una explicación completa de los modos de LOB, consulte Configuración de la compatibilidad de LOB con bases de datos de origen en una tarea de AWS DMS.

    • No incluya columnas LOB: las columnas LOB se excluyen de la migración.

    • Modo LOB completo: migre los LOB completos independientemente del tamaño. AWS DMSmigra los LOB por partes en fragmentos controlados por el parámetro Tamaño máximo de LOB. Este modo es más lento que utilizar el modo de LOB limitado.

    • Modo LOB limitado: trunca los LOB al valor especificado en el parámetro Tamaño máximo de LOB. Este modo es más rápido que utilizar el modo de LOB completo.

  • Mapeos de tablas: indica las tablas que se van a migrar y cómo se van a migrar. Para obtener más información, consulte Uso del mapeo de tablas para especificar la configuración de tareas.

  • Transformaciones de datos, tal y como se indica a continuación. Para obtener más información acerca de las transformaciones de datos, consulte Especificar reglas de selección y transformación de tablas mediante JSON.

    • Cambio de nombres de esquemas, tablas y columnas.

    • Cambio de nombres de espacios de tablas (para puntos de enlace de Oracle).

    • Definición de claves primarias e índices únicos en el destino.

  • Validación de datos

  • CloudWatch Registro en Amazon

Utiliza la tarea para migrar datos desde el punto de enlace de origen hasta el punto de enlace de destino y el procesamiento de tareas se realiza en la instancia de replicación. Especifica qué tablas y esquemas desea migrar y cualquier procesamiento especial, como, por ejemplo, los requisitos de registro, los datos de la tabla de control y la gestión de errores.

Conceptualmente, una tarea deAWS DMS replicación realiza dos funciones distintas, como se muestra en el siguiente diagrama.


                            Introducción a AWS DMS

El proceso de carga completa es sencillo de comprender. Los datos se extraen desde el origen de forma masiva y se cargan directamente en el destino. Puede especificar el número de tablas que extraer y cargar en paralelo en la consola de AWS DMS en Advanced Settings (Configuración avanzada).

Para obtener más información acerca de las tareas de AWS DMS, consulte Trabajo con tareas de AWS DMS.

Replicación continua o captura de datos de cambio (CDC)

También puede utilizar una tarea AWS DMS para capturar los cambios en curso en el almacén de datos de origen durante la migración de sus datos a un destino. El proceso de captura de cambios que AWS DMS utiliza para replicar los cambios en curso a partir de un punto de enlace de origen recopila los cambios en los registros de la base de datos mediante la API nativa del motor de la base de datos.

En el proceso de CDC, la tarea de replicación está diseñada para transmitir los cambios desde el origen al destino, utilizando búferes en memoria para almacenar datos en tránsito. Si los búferes en memoria se agotan por cualquier motivo, la tarea de replicación volcará los cambios pendientes en la caché de cambio en disco. Esto podría ocurrir, por ejemplo, si AWS DMS captura cambios desde el origen más rápido de lo que se pueden aplicar en el destino. En este caso, verá que la latencia de destino de la tarea supera la latencia de origen de la tarea.

Puede comprobar esto accediendo a su tarea en la consola de AWS DMS y abriendo la pestaña Task Monitoring (Monitorización de tareas). LosLatencySource gráficos de los CDCLatencyTarget y los CDC se muestran en la parte inferior de la página. Si tiene una tarea que muestra una latencia de destino, entonces probablemente es necesario realizar algún ajuste en el punto de enlace de destino para aumentar la tasa de aplicación.

La tarea de replicación también utiliza el almacenamiento para los registros de tareas, como se mencionó anteriormente. El espacio de disco que viene preconfigurado con su instancia de replicación suele ser suficiente para el registro y los cambios de volcado. Si necesita espacio en disco adicional, por ejemplo, cuando se utiliza la depuración detallada para investigar un problema de migración, puede modificar la instancia de replicación para asignar más espacio.