Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Solución de problemas de latencia en AWS Database Migration Service
Esta sección proporciona información general de las causas comunes de la latencia de las tareas de AWS DMS durante la fase de replicación en curso (CDC). AWS DMS replica los datos de forma asíncrona. La latencia es el tiempo transcurrido entre el momento en que se realizó un cambio en el origen y el momento en que el cambio se replicó en el destino. La latencia puede deberse a una configuración incorrecta de los componentes de la replicación, como los siguientes:
Punto de conexión de origen u origen de datos
Punto de conexión de destino u origen de datos
Instancias de replicación
La red entre estos componentes
Le recomendamos que utilice una migración de prueba como prueba de concepto para recopilar información sobre la replicación. A continuación, puede utilizar esta información para ajustar la configuración de replicación a fin de minimizar la latencia. Para obtener información sobre cómo ejecutar una migración de prueba de concepto, consulte Ejecución de una prueba de concepto.
Tipos de latencia de CDC
Esta sección contiene los tipos de latencia de replicación que pueden producirse durante CDC.
Latencia de origen
El retraso, en segundos, entre el tiempo de confirmación del último evento capturado desde el punto de conexión de origen y la marca temporal del sistema actual de la instancia de replicación. Puede monitorear la latencia entre el origen de datos y la instancia de replicación mediante la métrica de CloudWatch CDCLatencySource
. Una métrica CDCLatencySource
alta indica que el proceso de captura de los cambios de origen se ha retrasado. Por ejemplo, si la aplicación envía una inserción al origen a las 10:00 y AWS DMS consume el cambio a las 10:02, la métrica CDCLatencySource
es de 120 segundos.
Para obtener información acerca de las métricas de CloudWatch para AWS DMS, consulte Métricas de tareas de replicación.
Latencia de destino
El retraso, en segundos, entre la hora de confirmación en el origen del primer evento que espera confirmación en el destino y la marca temporal actual de la instancia de replicación de DMS. Puede monitorear la latencia entre confirmaciones en el origen de datos y el destino de datos mediante la métrica de CloudWatch CDCLatencyTarget
. Esto significa que CDCLatencyTarget
incluye cualquier retraso en la lectura del origen. Como resultado, CDCLatencyTarget
siempre es mayor o igual a CDCLatencySource
.
Por ejemplo, si la aplicación envía una inserción al origen a las 10:00 y AWS DMS la consume a las 10:02 y la escribe en el destino a las 10:05, la métrica CDCLatencyTarget
es de 300 segundos.
Causas comunes de la latencia de CDC
Esta sección contiene causas de latencia que la replicación puede experimentar durante CDC.
Temas
Recursos de puntos de conexión
Los siguientes factores afectan significativamente al rendimiento y la latencia de la replicación:
Configuraciones de bases de datos de origen y destino
Tamaño de instancia
Almacenes de datos de origen o destino mal aprovisionados o mal configurados
Para identificar las causas de la latencia causadas por problemas de punto de conexión en los orígenes y los destinos alojados en AWS, monitoree las siguientes métricas de CloudWatch:
FreeMemory
CPUUtilization
Métricas de rendimiento y E/S, como
WriteIOPS
,WriteThroughput
oReadLatency
Métricas de volumen de transacciones, como
CDCIncomingChanges
.
Para obtener más información acerca del monitoreo de métricas de CloudWatch, consulte AWS Database Migration Service métricas.
Recursos de instancias de replicación
Los recursos de las instancias de replicación son fundamentales para la replicación y debe asegurarse de que no haya cuellos de botella en los recursos, ya que pueden provocar latencia de origen y de destino.
Para identificar los cuellos de botella de recursos para la instancia de replicación, verifique lo siguiente:
Las métricas críticas de CloudWatch, como la CPU, la memoria, E/S por segundo y el almacenamiento, no experimentan picos ni valores altos de forma constante.
La instancia de replicación tiene el tamaño adecuado para la carga de trabajo. Para obtener información sobre cómo determinar el tamaño correcto de una instancia de replicación, consulte Selección del mejor tamaño para una instancia de replicación.
Velocidad y ancho de banda de la red
El ancho de banda de la red es un factor que afecta a la transmisión de datos. Para analizar el rendimiento de la red de la replicación, realice una de las siguientes acciones:
Compruebe las métricas
ReadThroughput
yWriteThroughput
en el nivel de la instancia. Para obtener más información acerca del monitoreo de métricas de CloudWatch, consulte AWS Database Migration Service métricas.Utilice la AMI de soporte de diagnóstico de AWS DMS. Si la AMI de soporte de diagnóstico no está disponible en la región, puede descargarla de cualquier región compatible y copiarla en la región para realizar el análisis de la red. Para obtener información acerca de la AMI de soporte de diagnóstico, consulte Trabajar con la AMI de soporte de diagnóstico de AWS DMS.
CDC en AWS DMS es un solo subproceso para garantizar la coherencia de datos. Como resultado, puede determinar el volumen de datos que admite la red calculando la velocidad de transferencia de datos de un solo subproceso. Por ejemplo, si la tarea se conecta al origen mediante una red de 100 Mbps (megabits por segundo), la replicación tiene una asignación de ancho de banda máxima teórica de 12,5 MBps (megabytes por segundo). Esto equivale a 45 gigabits por hora. Si la velocidad de generación del registro de transacciones en el origen es superior a 45 gigabits por hora, significa que la tarea tiene una latencia de CDC. Para una red de 100 MBps, estas velocidades son máximas teóricas; otros factores, como el tráfico de red y la sobrecarga de recursos en el origen y el destino reducen el ancho de banda disponible real.
Configuración de DMS
Esta sección contiene las configuraciones de replicación recomendadas que pueden ayudar a reducir la latencia.
Configuración de los puntos de conexión: la configuración de los puntos de conexión de origen y destino puede provocar que la instancia de replicación tenga un rendimiento deficiente. La configuración de los puntos de conexión que active características que consumen muchos recursos afectará al rendimiento. Por ejemplo, para un punto de conexión de Oracle, la desactivación de LogMiner y el uso de Binary Reader mejora el rendimiento, ya que LogMiner consume muchos recursos. La siguiente configuración de punto de conexión mejora el rendimiento de un punto de conexión de Oracle:
useLogminerReader=N;useBfile=Y
Para obtener más información acerca de la configuración de punto de conexión, consulte la documentación del motor de punto de conexión de origen y destino en el tema Trabajo con puntos de conexión de AWS DMS.
Configuración de tareas: algunas configuraciones de tareas para el escenario de replicación concreto pueden provocar que la instancia de replicación tenga un rendimiento deficiente. Por ejemplo, AWS DMS utiliza el modo de aplicación transaccional de forma predeterminada (
BatchApplyEnabled=false
) para CDC para todos los puntos de conexión, excepto para Amazon Redshift. Sin embargo, para los orígenes con un gran número de cambios, configurarBatchApplyEnabled
entrue
puede mejorar el rendimiento.Para obtener más información acerca de la configuración de tareas, consulte Especificación de la configuración de tareas para las tareas del AWS Database Migration Service.
Posición inicial de una tarea exclusiva de CDC: si se inicia una tarea exclusiva de CDC desde una posición o marca temporal en el pasado, se iniciará la tarea con una mayor latencia de origen de CDC. En función del volumen de cambios en el origen, la latencia de la tarea tardará un tiempo en desaparecer.
Configuración de LOB: los tipos de datos de objetos grandes pueden dificultar el rendimiento de la replicación debido a la forma en que AWS DMS replica los datos binarios grandes. Para obtener más información, consulte los temas siguientes:
Escenarios de replicaciones
En esta sección se describen los escenarios de replicación específicos y cómo pueden afectar a la latencia.
Temas
Detención de una tarea durante un periodo de tiempo prolongado
Al detener una tarea, AWS DMS guarda la posición del último registro de transacciones que se leyó desde el origen. Al reanudar la tarea, DMS intenta seguir leyendo desde la misma posición del registro de transacciones. Si se reanuda una tarea después de varias horas o días, la latencia de origen de CDC aumenta hasta que DMS termine de consumir la acumulación de transacciones pendientes.
Cambios en caché
Los cambios en caché son cambios que la aplicación escribe en el origen de datos mientras AWS DMS ejecuta la fase de replicación de carga completa. El DMS no aplica estos cambios hasta que se complete la fase de carga completa y comience la fase de CDC. Para un origen con un gran número de transacciones, los cambios en caché tardan más en aplicarse, por lo que la latencia del origen aumenta cuando comienza la fase de CDC. Le recomendamos que ejecute la fase de carga completa cuando los volúmenes de transacciones sean bajos para minimizar la cantidad de cambios en caché.
Replicación entre regiones
Ubicar los puntos de conexión de DMS o la instancia de replicación en diferentes regiones de AWS aumenta la latencia de la red. Esto aumenta la latencia de replicación. Para obtener el mejor rendimiento, ubique el punto de conexión de origen, el punto de conexión de destino y la instancia de replicación en la misma región de AWS.