Configuración de las tareas de los metadatos de destino - AWS Database Migration Service

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración de las tareas de los metadatos de destino

La configuración de metadatos de destino incluye lo siguiente. Para obtener información sobre cómo utilizar un archivo de configuración de tareas para establecer la configuración de las tareas, consulteEjemplo de configuración de tareas.

  • TargetSchema— El nombre del esquema de la tabla de destino. Si esta opción de metadatos está en blanco, se utiliza el esquema de la tabla de origen. Si no hay un esquema de origen definido, AWS DMS agrega automáticamente el prefijo del propietario de la base de datos de destino a todas las tablas. Esta opción debe estar en blanco para los puntos de enlace de destino de tipo MySQL.

  • Configuración de LOB: configuración que determina cómo se gestionan los objetos grandes (LOB). Si establece SupportLobs=true, debe establecer una de las siguientes opciones en true:

    • FullLobMode— Si configura esta opcióntrue, a continuación, debe introducir un valor paraLobChunkSizeopción. Indique el tamaño, en kilobytes, de los fragmentos del LOB que se van a utilizar cuando se repliquen los datos en el destino. La opción FullLobMode es más adecuada para los LOB de gran tamaño, pero suele ralentizar la carga. El valor recomendado paraLobChunkSizees de 64 kilobytes. Aumentar el valor deLobChunkSizeuna cantidad superior a 64 kilobytes puede provocar errores en las tareas.

    • InlineLobMaxSize— Este valor determina qué LOBAWS DMStransfiere en línea durante una carga completa. La transferencia de LOB pequeños es más eficaz que buscarlos de una tabla de origen. Durante una carga completa, AWS DMS comprueba todos los LOB y realiza una transferencia en línea para los LOB de tamaño inferior a InlineLobMaxSize. AWS DMS transfiere todos los LOB de tamaño superior a InlineLobMaxSize en FullLobMode. El valor por defecto deInlineLobMaxSizees 0 y el rango es de 1 a 102400 kilobytes (100 MB). Establezca un valor para InlineLobMaxSize solo si sabe que la mayor parte de los LOB tienen un tamaño inferior al valor especificado en InlineLobMaxSize.

    • LimitedSizeLobMode— Si configura esta opcióntrue, a continuación, debe introducir un valor paraLobMaxSizeopción. Indique el tamaño máximo, en kilobytes, para un LOB específico. El valor máximo recomendado paraLobMaxSizees de 102400 kilobytes (100 MB).

    Para obtener más información acerca de cómo utilizar la configuración de LOB de tareas, consulteConfiguración de la compatibilidad de LOB con bases de datos de origen en una tarea de AWS DMS. También puede controlar la administración de LOB para tablas individuales. Para obtener más información, consulte Configuración, reglas y operaciones de tablas y colecciones.

  • LoadMaxFileSize— Una opción para puntos de enlace de destino basados en CSV, como MySQL, PostgreSQL y Amazon Redshift, que admiten el uso de archivos de valores separados por comas (.csv) para cargar datos.LoadMaxFileSizedefine el tamaño máximo del disco de los datos almacenados y descargados, como los archivos.csv. Esta opción anula el atributo de conexión del punto final de destino,maxFileSize. Puede especificar valores a partir de 0, que indica que esta opción no anula el atributo de conexión, hasta 100 000 KB.

  • BatchApplyEnabled— Determina si cada transacción se aplica de forma individual o si los cambios se confirman en lotes. El valor predeterminado es false.

    ¿CuándoBatchApplyEnabledestá configurado entrue, el DMS requiere una clave principal (PK) o una clave única (UK) en elfuenteTabla (s). Si las tablas de origen no incluyen el código postal ni el Reino Unido, solo se aplican las inserciones por lotes, pero no las actualizaciones ni eliminaciones por lotes.

    ¿CuándoBatchApplyEnabledestá configurado entrue,AWS DMSgenera un mensaje de error siobjetivola tabla tiene una restricción única y una clave principal. Las tablas de destino con una restricción única y una clave principal no son compatibles cuandoBatchApplyEnabledestá configurado entrue.

    ¿CuándoBatchApplyEnabledse establece en verdadero yAWS DMSencuentra un error de datos en una tabla con la política de gestión de errores predeterminada, laAWS DMSla tarea cambia del modo por lotes a one-by-one modo para el resto de las tablas. Para modificar este comportamiento, puede configurar el"SUSPEND_TABLE"acción sobre las siguientes políticas en el"ErrorBehavior"propiedad de grupo del archivo JSON de configuración de tareas:

    • DataErrorPolicy

    • ApplyErrorDeletePolicy

    • ApplyErrorInsertPolicy

    • ApplyErrorUpdatePolicy

    Para más información sobre este"ErrorBehavior"propiedad de grupo, consulte el ejemplo del archivo JSON de configuración de tareas enEspecificar la configuración de la tarea paraAWSTareas del Database Migration Service. Tras configurar estas políticas en"SUSPEND_TABLE", elAWS DMSa continuación, la tarea suspende los errores de datos en las tablas que los generen y continúa en modo por lotes para todas las tablas.

    Puede utilizar elBatchApplyEnabledparámetro con elBatchApplyPreserveTransactionparámetro. Si BatchApplyEnabled está establecido en true, el parámetro BatchApplyPreserveTransaction determina la integridad de las transacciones.

    Si BatchApplyPreserveTransaction está establecido en true, se mantiene la integridad de las transacciones y se garantiza que un lote contendrá todos los cambios en una transacción desde el origen.

    Si BatchApplyPreserveTransaction está establecido en false, pueden producirse interrupciones temporales en la integridad de las transacciones para mejorar el desempeño.

    El parámetro BatchApplyPreserveTransaction se aplica únicamente a los puntos de enlace de destino de Oracle y solo es pertinente cuando el parámetro BatchApplyEnabled está establecido en true.

    Cuando se incluyen columnas de LOB en la replicación, BatchApplyEnabled solo se puede utilizar en modo de LOB limitado.

    Para obtener más información sobre el uso de esta configuración para una carga de captura de datos de cambios (CDC), consulteConfiguración de ajuste del procesamiento de cambios.

  • MaxFullLoadSubTasks— indica el número máximo de tablas que se pueden cargar en paralelo. El valor predeterminado es 8, el valor máximo es 49.

  • ParallelLoadThreads— Especifica el número de hilos queAWS DMSutiliza para cargar cada tabla en la base de datos de destino. Este parámetro tiene valores máximos para los objetivos que no son de RDBMS. El valor máximo para un objetivo de DynamoDB es 200. El valor máximo para Amazon Kinesis Data Streams, Apache Kafka o Amazon OpenSearch El objetivo del servicio es 32. Puede solicitar que se aumente este límite máximo.ParallelLoadThreadsse aplica a las tareas de carga completa. Para obtener información acerca de la configuración de la carga paralela de las tablas individuales, consulte Configuración, reglas y operaciones de tablas y colecciones.

    Esta configuración se aplica a los siguientes tipos de motores de punto final:

    • DynamoDB

    • Amazon Kinesis Data Streams

    • Amazon MSK

    • Amazon OpenSearch Servicio

    • Amazon Redshift

    AWS DMSsoportaParallelLoadThreadspara MySQL como atributo de conexión adicional.ParallelLoadThreadsno se aplica a MySQL como configuración de tareas.

  • ParallelLoadBufferSizeEspecifica el número máximo de registros que se almacenarán en el búfer que utilizan los subprocesos de carga paralela para cargar datos en el destino. El valor predeterminado es 50. El valor máximo es 1000. Actualmente, esta configuración solo es válida en DynamoDB, Kinesis, Apache Kafka o OpenSearch es el objetivo Utilice este parámetro con ParallelLoadThreads. ParallelLoadBufferSize solo es válido cuando hay más de un subproceso. Para obtener información acerca de la configuración de la carga paralela de las tablas individuales, consulte Configuración, reglas y operaciones de tablas y colecciones.

  • ParallelLoadQueuesPerThread— Especifica el número de colas a las que accede cada subproceso simultáneo para extraer los registros de datos de las colas y generar una carga por lotes para el destino. El valor predeterminado es 1. Actualmente, esta configuración solo es válida cuando Kinesis o Apache Kafka son el objetivo.

  • ParallelApplyThreads— Especifica el número de subprocesos simultáneos queAWS DMSse utiliza durante una carga de CDC para enviar registros de datos a Amazon DocumentDB, Kinesis, Amazon MSK, OpenSearch, o punto final de destino de Amazon Redshift. El valor por defecto es cero (0).

    Esta configuración solo se aplica a CDC únicamente. Esta configuración no se aplica a carga completa.

    Esta configuración se aplica a los siguientes tipos de motores de punto final:

    • Amazon DocumentDB (con compatibilidad con MongoDB)

    • Amazon Kinesis Data Streams

    • Amazon Managed Streaming for Apache Kafka

    • Amazon OpenSearch Servicio

    • Amazon Redshift

  • ParallelApplyBufferSize— Especifica el número máximo de registros que se deben almacenar en cada cola de búfer para que los subprocesos simultáneos se envíen a Amazon DocumentDB, Kinesis, Amazon MSK, OpenSearch, o el punto final de destino de Amazon Redshift durante una carga de CDC. El valor predeterminado es 100. Utilice esta opción cuando ParallelApplyThreads especifique más de un subproceso.

  • ParallelApplyQueuesPerThread— Especifica el número de colas a las que accede cada subproceso para extraer los registros de datos de las colas y generar una carga por lotes para Amazon DocumentDB, Kinesis, Amazon MSK o OpenSearchpunto final durante la CDC. El valor predeterminado es 1.