Elegir el mejor tamaño para una instancia de replicación - AWS Database Migration Service

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Elegir el mejor tamaño para una instancia de replicación

La selección de la instancia de replicación adecuada depende de varios factores del caso de uso. Para ayudar a entender cómo se utilizan los recursos de instancias de replicación, consulte la siguiente explicación. Trata la situación habitual de una tarea de carga completa + CDC.

Durante una tarea de carga completa, AWS DMS carga las tablas de manera individual. De forma predeterminada, se cargan ocho tablas cada vez. AWS DMS captura los cambios en curso al origen durante una tarea de carga completa de modo que los cambios se puedan aplicar más adelante en el punto de enlace de destino. Los cambios se almacenan en caché en la memoria y, en caso de agotarse la memoria disponible, se almacenan en la memoria caché del disco. Al completarse una tarea de carga completa para una tabla, AWS DMS aplica inmediatamente los cambios almacenados en caché a la tabla de destino.

Después de que se hayan aplicado todos los cambios en la memoria caché pendientes para una tabla, el punto de enlace de destino se encuentra en un estado coherente desde el punto de vista transaccional. En este momento, el destino está sincronizado con el punto de enlace de origen con respecto a los últimos cambios almacenados en caché. AWS DMS a continuación, comienza la replicación continua entre el origen y el destino. Para ello,AWS DMS toma las operaciones de cambio de los registros de transacciones de origen y las aplica al destino de manera coherente desde el punto de vista transaccional. (Este proceso asume que la aplicación optimizada por lotes no está seleccionada). AWS DMStransmite los cambios en curso a través de la memoria de la instancia de replicación, si es posible. De lo contrario, AWS DMS escribe los cambios en el disco en la instancia de replicación hasta que pueden aplicarse al destino.

El usuario tiene cierto control sobre la forma en que la instancia de replicación gestiona el procesamiento de los cambios y sobre cómo se utiliza la memoria en dicho proceso. Para obtener más información acerca de cómo ajustar el procesamiento de cambios, consulte Configuración de ajuste del procesamiento de cambios.

Factores a tener en cuenta

La memoria y el espacio en disco son factores clave a la hora de seleccionar una instancia de replicación adecuada para su caso de uso. A continuación, encontrará un análisis de las características de los casos de uso que debe analizar para elegir una instancia de replicación.

  • Tamaño de base de datos y tabla de

    El volumen de datos ayuda a determinar la configuración de la tarea para optimizar el rendimiento a plena carga. Por ejemplo, para dos esquemas de 1 TB, puede particionar tablas en cuatro tareas de 500 GB y ejecutarlas en parallel. El posible paralelismo depende del recurso de CPU disponible en la instancia de replicación. Por eso es una buena idea entender el tamaño de la base de datos y las tablas para optimizar el rendimiento a plena carga. Ayuda a determinar la cantidad de tareas que puede realizar.

  • Objetos grandes

    Los tipos de datos que están presentes en el ámbito de la migración pueden afectar al rendimiento. En particular, los objetos grandes (LOB) afectan al rendimiento y al consumo de memoria. Para migrar un valor LOB,AWS DMS realiza un proceso de dos pasos. Primero,AWS DMS inserta la fila en el objetivo sin el valor LOB. En segundo lugar,AWS DMS actualiza la fila con el valor LOB. Esto tiene un impacto en la memoria, por lo que es importante identificar las columnas LOB en la fuente y analizar su tamaño.

  • Frecuencia de carga y tamaño de transacción

    La frecuencia de carga y las transacciones por segundo (TPS) influyen en el uso de la memoria. Un gran número de actividades de TPS o lenguaje de manipulación de datos (DML) conduce a un uso elevado de la memoria. Esto ocurre porque el DMS almacena en caché los cambios hasta que se apliquen al objetivo. Durante la CDC, esto provoca el intercambio (escritura en el disco físico debido al desbordamiento de la memoria), lo que provoca latencia.

  • Teclas de tabla e integridad referencial

    La información sobre las claves de la tabla determina el modo CDC (aplicación por lotes o aplicación transaccional) que se utiliza para migrar los datos. En general, la aplicación transaccional es más lenta que la aplicación por lotes. En el caso de las transacciones de larga duración, la migración puede llevar a cabo muchos cambios. Cuando se utiliza la aplicación transaccional,AWS DMS es posible que se necesite más memoria para almacenar los cambios en comparación con la aplicación por lotes. Si migra tablas sin claves principales, se producirá un error en la aplicación por lotes y la tarea de DMS pasará al modo de aplicación transaccional. Cuando la integridad referencial está activa entre tablas durante la CDC,AWS DMS utiliza la aplicación transaccional de forma predeterminada. Para obtener más información sobre la aplicación por lotes en comparación con la aplicación transaccional, consulte ¿Cómo puedo utilizar la función de aplicación por lotes del DMS para mejorar el rendimiento de la replicación de los CDC? .

Utilice estas métricas para determinar si necesita que la instancia de replicación esté optimizada para la computación o la memoria.

Problemas comunes

Es posible que se enfrente a los siguientes problemas comunes que provocan la contención de recursos en la instancia de replicación durante la migración. Para obtener información sobre las métricas de la instancia de replicación, consulteMétricas de instancia de replicación.

  • Si la memoria de una instancia de replicación se vuelve insuficiente, se escribirán datos en el disco. La lectura del disco puede provocar latencia, que puede evitarse dimensionando la instancia de replicación con suficiente memoria.

  • El tamaño del disco asignado a la instancia de replicación puede ser inferior al necesario. El tamaño del disco se usa cuando los datos de la memoria se desbordan; también se usa para almacenar los registros de tareas. La cantidad máxima de IOPS también depende de ello.

  • La ejecución de varias tareas o tareas con un alto paralelismo afecta al consumo de CPU de la instancia de replicación. Esto ralentiza el procesamiento de las tareas y produce latencia.

Prácticas recomendadas

Tenga en cuenta estas dos prácticas recomendadas más comunes al dimensionar una instancia de replicación. Para obtener más información, consulte Prácticas recomendadas para AWS Database Migration Service.

  1. Evalúe su carga de trabajo y comprenda si requiere un uso intensivo de la computadora o de la memoria. En función de esto, puede determinar la clase y el tamaño de la instancia de replicación:

    • AWS DMSprocesa los LOB en la memoria. Esta operación requiere una cantidad considerable de memoria.

    • La cantidad de tareas y la cantidad de subprocesos afectan al consumo de CPU. Evite utilizar más de ochoMaxFullLoadSubTasks durante la operación a plena carga.

  2. Aumente el espacio en disco asignado a la instancia de replicación cuando tenga una carga de trabajo elevada durante la carga completa. Esto permite que la instancia de replicación utilice la cantidad máxima de IOPS que se le ha asignado.

Las directrices anteriores no cubren todos los escenarios posibles. Es importante tener en cuenta las características específicas de su caso de uso particular al determinar el tamaño de la instancia de replicación.

Las pruebas anteriores muestran que la CPU y la memoria varían según las diferentes cargas de trabajo. En particular, los LOB afectan a la memoria y el recuento de tareas o el paralelismo afectan a la CPU. Una vez ejecutada la migración, supervise la CPU, la memoria liberable, el almacenamiento libre y las IOPS de la instancia de replicación. En función de los datos que recopile, puede ampliar o reducir las dimensiones de la instancia de replicación según sea necesario.