Tipos de latencia de CDC Causas comunes de la latencia de CDC

Solución de problemas de latencia en AWS Database Migration Service

En esta sección se proporciona una descripción general de las causas más comunes de la latencia de las AWS DMS tareas durante la fase de replicación en curso (CDC). AWS DMS replica los datos de forma asíncrona. La latencia es el tiempo transcurrido entre el momento en que se realizó un cambio en el origen y el momento en que el cambio se replicó en el destino. La latencia puede deberse a una configuración incorrecta de los componentes de la replicación, como los siguientes:

Punto de conexión de origen u origen de datos
Punto de conexión de destino u origen de datos
Instancias de replicación
La red entre estos componentes

Le recomendamos que utilice una migración de prueba como prueba de concepto para recopilar información sobre la replicación. A continuación, puede utilizar esta información para ajustar la configuración de replicación a fin de minimizar la latencia. Para obtener información sobre cómo ejecutar una migración de prueba de concepto, consulte Ejecución de una prueba de concepto.

Temas

Tipos de latencia de CDC
Causas comunes de la latencia de CDC
Solución de problemas de latencia

Tipos de latencia de CDC

Esta sección contiene los tipos de latencia de replicación que pueden producirse durante CDC.

Latencia de origen

El retraso, en segundos, entre el tiempo de confirmación del último evento capturado desde el punto de conexión de origen y la marca temporal del sistema actual de la instancia de replicación. Puede supervisar la latencia entre la fuente de datos y la instancia de replicación mediante la métrica. CDCLatencySource CloudWatch Una métrica CDCLatencySource alta indica que el proceso de captura de los cambios de origen se ha retrasado. Por ejemplo, si su aplicación envía una inserción a la fuente a las 10:00, y AWS DMS consume el cambio a las 10:02, la CDCLatencySource métrica es de 120 segundos.

Para obtener información sobre CloudWatch las métricas de, consulte. AWS DMSMétricas de tareas de replicación

Latencia de destino

El retraso, en segundos, entre la hora de confirmación en el origen del primer evento que espera confirmación en el destino y la marca temporal actual de la instancia de replicación de DMS. Puedes monitorizar la latencia entre las confirmaciones en la fuente de datos y en tu destino de datos mediante la CDCLatencyTarget CloudWatch métrica. Esto significa que CDCLatencyTarget incluye cualquier retraso en la lectura del origen. Como resultado, CDCLatencyTarget siempre es mayor o igual a CDCLatencySource.

Por ejemplo, si tu aplicación confirma una inserción en la fuente a las 10:00, la AWS DMS consume a las 10:02 y la escribe en el destino a las 10:05, la CDCLatencyTarget métrica es de 300 segundos.

Causas comunes de la latencia de CDC

Esta sección contiene causas de latencia que la replicación puede experimentar durante CDC.

Recursos de puntos de conexión

Los siguientes factores afectan significativamente al rendimiento y la latencia de la replicación:

Configuraciones de bases de datos de origen y destino
Tamaño de instancia
Almacenes de datos de origen o destino mal aprovisionados o mal configurados

Para identificar las causas de la latencia provocada por problemas de punto final en las fuentes y los destinos AWS alojados, supervisa las siguientes métricas: CloudWatch

FreeMemory
CPUUtilization
Rendimiento y I/O métricas, comoWriteIOPS, WriteThroughput o ReadLatency
Métricas de volumen de transacciones, como CDCIncomingChanges.

Para obtener información sobre la supervisión de CloudWatch las métricas, consulteAWS Database Migration Service métricas.

Recursos de instancias de replicación

Los recursos de las instancias de replicación son fundamentales para la replicación y debe asegurarse de que no haya cuellos de botella en los recursos, ya que pueden provocar latencia de origen y de destino.

Para identificar los cuellos de botella de recursos para la instancia de replicación, verifique lo siguiente:

CloudWatch Las métricas críticas, como la CPU, la memoria, el consumo I/O por segundo y el almacenamiento, no experimentan picos ni valores altos de forma constante.
La instancia de replicación tiene el tamaño adecuado para la carga de trabajo. Para obtener información sobre cómo determinar el tamaño correcto de una instancia de replicación, consulte Selección del mejor tamaño para una instancia de replicación.

Velocidad y ancho de banda de la red

El ancho de banda de la red es un factor que afecta a la transmisión de datos. Para analizar el rendimiento de la red de la replicación, realice una de las siguientes acciones:

Compruebe las métricas ReadThroughput y WriteThroughput en el nivel de la instancia. Para obtener información sobre la supervisión de CloudWatch las métricas, consulte. AWS Database Migration Service métricas
Utilice la AMI de AWS DMS Diagnostic Support. Si la AMI de soporte de diagnóstico no está disponible en la región, puede descargarla de cualquier región compatible y copiarla en la región para realizar el análisis de la red. Para obtener información acerca de la AMI de soporte de diagnóstico, consulte Trabajar con el soporte de AWS DMS diagnóstico (AMI).

Los CDC in utilizan AWS DMS un único subproceso para garantizar la coherencia de los datos. Como resultado, puede determinar el volumen de datos que admite la red calculando la velocidad de transferencia de datos de un solo subproceso. Por ejemplo, si la tarea se conecta a su origen mediante una red de 100 Mbps (megabits por segundo), la replicación tiene una asignación de ancho de banda máxima teórica de 12,5 MBps (megabytes por segundo). Esto equivale a 45 gigabits por hora. Si la velocidad de generación del registro de transacciones en el origen es superior a 45 gigabits por hora, significa que la tarea tiene una latencia de CDC. Para una MBps red de 100, estas velocidades son máximos teóricos; otros factores, como el tráfico de red y la sobrecarga de recursos en el origen y el destino, reducen el ancho de banda disponible real.

Configuración de DMS

Esta sección contiene las configuraciones de replicación recomendadas que pueden ayudar a reducir la latencia.

Configuración de los puntos de conexión: la configuración de los puntos de conexión de origen y destino puede provocar que la instancia de replicación tenga un rendimiento deficiente. La configuración de los puntos de conexión que active características que consumen muchos recursos afectará al rendimiento. Por ejemplo, en el caso de un terminal de Oracle, la desactivación LogMiner y el uso de Binary Reader mejoran el rendimiento, ya que consumen muchos recursos LogMiner . La siguiente configuración de punto de conexión mejora el rendimiento de un punto de conexión de Oracle:
```
useLogminerReader=N;useBfile=Y
```
Para obtener más información acerca de la configuración de punto de conexión, consulte la documentación del motor de punto de conexión de origen y destino en el tema Trabajando con puntos finales de DMS AWS.
Configuración de tareas: algunas configuraciones de tareas para el escenario de replicación concreto pueden provocar que la instancia de replicación tenga un rendimiento deficiente. Por ejemplo, AWS DMS utiliza el modo de aplicación transaccional de forma predeterminada (BatchApplyEnabled=false) para CDC para todos los puntos de conexión, excepto para Amazon Redshift. Sin embargo, para los orígenes con un gran número de cambios, configurar BatchApplyEnabled en true puede mejorar el rendimiento.

Para obtener más información acerca de la configuración de tareas, consulte Especificar la configuración de tareas para las tareas del AWS Database Migration Service.
Posición inicial de una tarea exclusiva de CDC: si se inicia una tarea exclusiva de CDC desde una posición o marca temporal en el pasado, se iniciará la tarea con una mayor latencia de origen de CDC. En función del volumen de cambios en el origen, la latencia de la tarea tardará un tiempo en desaparecer.
Configuración de LOB: los tipos de datos de objetos grandes pueden dificultar el rendimiento de la replicación debido a la forma en que se AWS DMS replican los datos binarios de gran tamaño. Para obtener más información, consulte los temas siguientes:
- Configurar la compatibilidad con LOB para las bases de datos de origen de una tarea AWS DMS
- Migración de objetos binarios grandes () LOBs.

Escenarios de replicaciones

En esta sección se describen los escenarios de replicación específicos y cómo pueden afectar a la latencia.

Temas

Detención de una tarea durante un periodo de tiempo prolongado
Cambios en caché
Replicación entre regiones

Detención de una tarea durante un periodo de tiempo prolongado

Al detener una tarea, AWS DMS guarda la posición del último registro de transacciones que se leyó desde la fuente. Al reanudar la tarea, DMS intenta seguir leyendo desde la misma posición del registro de transacciones. Si se reanuda una tarea después de varias horas o días, la latencia de origen de CDC aumenta hasta que DMS termine de consumir la acumulación de transacciones pendientes.

Cambios en caché

Los cambios en caché son cambios que la aplicación escribe en la fuente de datos mientras AWS DMS ejecuta la fase de replicación a plena carga. El DMS no aplica estos cambios hasta que se complete la fase de carga completa y comience la fase de CDC. Para un origen con un gran número de transacciones, los cambios en caché tardan más en aplicarse, por lo que la latencia del origen aumenta cuando comienza la fase de CDC. Le recomendamos que ejecute la fase de carga completa cuando los volúmenes de transacciones sean bajos para minimizar la cantidad de cambios en caché.

Replicación entre regiones

Ubicar los puntos finales del DMS o la instancia de replicación en diferentes AWS regiones aumenta la latencia de la red. Esto aumenta la latencia de replicación. Para obtener el mejor rendimiento, ubique el punto final de origen, el punto final de destino y la instancia de replicación en la misma AWS región.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Soporte de diagnóstico y solución de problemas

Solución de problemas de latencia