Ejecución de un trabajo de traducción por lotes - Amazon Translate

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ejecución de un trabajo de traducción por lotes

Puede ejecutar un trabajo de traducción por lotes mediante la consola de Amazon Translate, AWS CLI, o la API de Amazon Translate.

nota

Los trabajos de traducción por lotes son operaciones de larga duración y pueden tardar mucho tiempo en completarse. Por ejemplo, la traducción por lotes de un conjunto de datos pequeño puede tardar unos minutos, mientras que los conjuntos de datos muy grandes pueden tardar dos días o más. El tiempo de finalización depende también de la disponibilidad de los recursos.

Para ejecutar un trabajo de traducción mediante la consola de Amazon Translate, utilice la página Traducción por lotes para crear el trabajo:

  1. Abra la consola de Amazon Translate.

  2. En el menú de navegación de la izquierda, elija Traducción por lotes.

  3. En la página Trabajos de traducción, seleccione Crear trabajo. La consola muestra la página Crear trabajo de traducción.

  4. En Configuración de trabajo, realice lo siguiente:

    1. En Nombre, introduzca un nombre personalizado para el trabajo de traducción por lotes.

    2. En Idioma de origen, seleccione el idioma de los archivos de origen. Si no conoce el idioma de los archivos de origen o si los documentos de entrada contienen idiomas de origen diferentes, seleccione auto. Amazon Translate detecta automáticamente el idioma de origen de cada archivo.

    3. En Idioma de destino, selecciona hasta 10 idiomas. Amazon Translate traduce cada archivo de origen a cada idioma de destino.

  5. En Datos de entrada, haga lo siguiente:

    1. En la ubicación de S3, especifique la carpeta de entrada que contiene los archivos de origen de traducción en Amazon S3. Para especificar la carpeta navegando hasta ella en Amazon S3, elija Seleccionar carpeta.

    2. En Formato de archivo, seleccione el formato de los archivos de origen de la traducción.

  6. En Datos de salida, haga lo siguiente:

    1. En la ubicación de Output S3, especifique la carpeta de salida en Amazon S3 donde Amazon Translate coloca la salida de la traducción. Para especificar la carpeta navegando hasta ella en Amazon S3, elija Seleccionar carpeta.

    2. Si lo desea, elija Personalizar la configuración de cifrado (avanzado) si desea cifrar la salida con una clave gestionada por el cliente que gestione en AWS Key Management Service (AWS KMS).

      De forma predeterminada, Amazon Translate cifra la salida de la traducción mediante una clave de KMS que AWS crea, administra y usa en su nombre. Elija esta opción si prefiere cifrar la salida con su propia clave KMS.

      Si desea utilizar una clave de KMS de la cuenta de AWS actual, selecciónela en Choose an AWS Key Management Service key. O bien, si desea utilizar una clave de KMS de una cuenta de AWS diferente, introduzca el nombre de recurso de Amazon (ARN) de esa clave.

      nota

      Para poder utilizar su propia clave de KMS, antes debe añadir permisos al rol de servicio de Amazon Translate en IAM. Si desea utilizar una clave de KMS de una cuenta diferente, también debe actualizar la política de claves enAWS KMS. Para más información, consulte Permisos necesarios para personalizar el cifrado.

  7. En Customizations - optional, puede elegir personalizar la salida de su trabajo de traducción con los siguientes ajustes:

    Blasfemia

    Enmascara palabras y frases soeces en la salida de la traducción. Si especifica varios idiomas de destino para el trabajo, todos los idiomas de destino deben admitir la enmascaración de blasfemias. Si alguno de los idiomas de destino no admite la enmascaración de blasfemias, el trabajo de traducción no ocultará las blasfemias de ningún idioma de destino.

    Para más información, consulte Enmascarar palabras y frases soeces en Amazon Translate.

    Brevedad

    Amazon Translate no admite la brevedad en los trabajos de traducción por lotes.

    Para más información, consulte Uso de la brevedad en Amazon Translate.

    Formalidad

    Para algunos idiomas de destino, puede configurar la Formalidad como formal o informal. Si especifica varios idiomas de destino para el trabajo, Translate ignora la configuración de formalidad para cualquier idioma de destino no compatible.

    Para más información, consulte Configuración del nivel formalidad en Amazon Translate.

    Terminología personalizada

    Consta de ejemplos de términos de origen y la traducción deseada para cada término. Si especifica varios idiomas de destino para el trabajo, Translate utiliza la terminología designada para cada idioma de destino solicitado que tenga una entrada para el término de origen en el archivo terminológico.

    Para más información, consulte Personalización de las traducciones con terminología personalizada.

    Datos paralelos

    Consta de ejemplos que muestran cómo desea que se traduzcan los segmentos de texto. Si especifica varios idiomas de destino para el trabajo, el archivo de datos paralelos debe incluir las traducciones de todos los idiomas de destino.

    Al añadir datos paralelos a un trabajo de traducción por lotes, se crea un trabajo de traducción personalizada activa.

    nota

    Los trabajos de traducción personalizada activa tienen un precio más alto que otros trabajos que no utilizan datos paralelos. Para obtener más información, consulte Precios de Amazon Translate.

    Para más información, consulte Personalización de las traducciones con datos paralelos (Active Custom Translation).

  8. En Permisos de acceso, asigne a Amazon Translate una función de IAM que conceda los permisos necesarios a sus archivos de entrada y salida en Amazon S3:

    • Si ya tiene este rol de IAM en su cuenta, elija Usar un rol de IAM existente y selecciónelo en Rol de IAM.

    • Si aún no tiene este rol de IAM en su cuenta, seleccione Crear un rol de IAM. Para el Rol de IAM, elija Input and output S3 buckets. Para Nombre del rol, facilite un nombre. Al crear el trabajo de traducción, Amazon Translate crea el rol automáticamente. El nombre del rol en IAM lleva el prefijo -. AmazonTranslateServiceRole

      nota

      Si opta por cifrar la salida de la traducción con su propia clave de KMS, no podrá elegir Crear un rol de IAM. En este caso, debe usar un rol de IAM preexistente y su clave de KMS debe tener una política de claves que permita al rol usar la clave.

      Para obtener más información, consulte Permisos necesarios para personalizar el cifrado

  9. Seleccione Crear trabajo.

    La consola vuelve a la página de Trabajos de traducción, donde se muestra el estado de creación del trabajo en un banner en la parte superior de la página. Transcurridos unos minutos, se muestra su trabajo en la tabla.

  10. Elija el nombre del trabajo en la columna Nombre para abrir la página de detalles del trabajo.

    Mientras se ejecuta el trabajo de traducción, el campo Estado muestra En curso.

  11. Cuando el estado pase a ser Completado, vaya a la salida de la traducción seleccionando el enlace situado debajo de Ubicación del archivo de salida. En la consola muestra el bucket de salida en Amazon S3.

  12. Para descargar los archivos de salida, active la casilla de verificación de cada uno y elija Descargar.

Para ejecutar un trabajo de traducción mediante la AWS CLI, utilice el comando start-text-translation-job y especifique el nombre del recurso de datos paralelos para el parámetro parallel-data-names.

ejemplo Comando S tart-text-translation-job

En el siguiente ejemplo se ejecuta un trabajo de traducción mediante el envío de un archivo de Excel que se almacena en un bucket de entrada en Amazon S3. Este trabajo se personaliza con los datos paralelos que se incluyen en la solicitud.

$ aws translate start-text-translation-job \ > --input-data-config ContentType=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet,S3Uri=s3://my-s3-bucket/input/ \ > --output-data-config S3Uri=s3://my-s3-bucket/output/ \ > --data-access-role-arn arn:aws:iam::111122223333:role/my-iam-role \ > --source-language-code en \ > --target-language-codes es it \ > --job-name my-translation-job

Si el comando se ejecuta correctamente, Amazon Translate responde con el ID y el estado del trabajo:

{ "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobStatus": "SUBMITTED" }

Si desea personalizar la salida de su trabajo de traducción, puede usar los siguientes parámetros:

--settings

Ajustes para configurar la salida de la traducción, incluidas las siguientes opciones:

Activa la brevedad en el resultado de la traducción. Amazon Translate no admite la brevedad en los trabajos de traducción por lotes. Para más información, consulte Uso de la brevedad en Amazon Translate.

Active la blasfemia para enmascarar palabras y frases soeces. Para habilitarla, establezca el parámetro de palabras soeces en Profanity=MASK. Para más información, consulte Enmascarar palabras y frases soeces en Amazon Translate. Si alguno de los idiomas de destino no admite la enmascaración de palabras soeces, el trabajo de traducción no ocultará las de ningún idioma de destino.

Establezca el nivel de formalidad en la salida de la traducción. Establezca el parámetro Formality en FORMAL o INFORMAL. Si especifica varios idiomas de destino para el trabajo, Translate ignora la configuración de formalidad para cualquier idioma de destino no compatible. Para más información, consulte Configuración del nivel formalidad en Amazon Translate.

--terminology-names

El nombre de un recurso terminológico personalizado que se va a añadir al trabajo de traducción. Este recurso enumera ejemplos de términos de origen y la traducción deseada para cada término. Si especifica varios idiomas de destino para el trabajo, Translate utiliza la terminología designada para cada idioma de destino solicitado que tenga una entrada para el término de origen en el archivo terminológico.

Este parámetro solo acepta un recurso terminológico personalizado.

Para obtener una lista de los recursos terminológicos personalizados disponibles, utilice el comando list-terminologies.

Para más información, consulte Personalización de las traducciones con terminología personalizada.

--parallel-data-names

El nombre de un recurso de datos paralelo que se va a añadir al trabajo de traducción. Este recurso consta de ejemplos que muestran cómo desea que se traduzcan los segmentos de texto. Si especifica varios idiomas de destino para el trabajo, el archivo de datos paralelos debe incluir las traducciones de todos los idiomas de destino.

Al añadir datos paralelos a un trabajo de traducción, se crea un trabajo de traducción personalizada activa.

Este parámetro solo acepta un recurso de datos paralelos.

nota

Los trabajos de traducción personalizada activa tienen un precio más alto que otros trabajos que no utilizan datos paralelos. Para obtener más información, consulte Precios de Amazon Translate.

Para obtener una lista de los recursos de datos paralelos disponibles, utilice el comando list-parallel-data.

Para más información, consulte Personalización de las traducciones con datos paralelos (Active Custom Translation).

Para comprobar el estado de su trabajo de traducción, use el comando describe-text-translation-job.

ejemplo Comando D. escribe-text-translation-job

En el siguiente ejemplo se comprueba el estado del trabajo proporcionando el identificador del trabajo. Amazon Translate proporcionó este identificador cuando el comando start-text-translation-job inició el trabajo.

$ aws translate describe-text-translation-job \ > --job-id 4446f95f20c88a4b347449d3671fbe3d

Amazon Translate responde con las propiedades del trabajo, que incluyen su estado:

{ "TextTranslationJobProperties": { "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobName": "my-translation-job", "JobStatus": "COMPLETED", "JobDetails": { "TranslatedDocumentsCount": 0, "DocumentsWithErrorsCount": 0, "InputDocumentsCount": 1 }, "SourceLanguageCode": "en", "TargetLanguageCodes": [ "es", "it" ], "SubmittedTime": 1598661012.468, "InputDataConfig": { "S3Uri": "s3://my-s3-bucket/input/", "ContentType": "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet" }, "OutputDataConfig": { "S3Uri": "s3://my-s3-bucket/output/111122223333-TranslateText-4446f95f20c88a4b347449d3671fbe3d/" }, "DataAccessRoleArn": "arn:aws:iam::111122223333:role/my-iam-role" } }

Si el valor de JobStatus esIN_PROGRESS, deje pasar unos minutos y vuelva a ejecutar describe-text-translation-job hasta que el estado sea COMPLETED. Cuando se complete el trabajo, puede descargar las salidas de la traducción en la ubicación indicada en el campo S3Uri debajo de OutputDataConfig.

Para enviar un trabajo de traducción por lotes mediante la API Amazon Translate, utilice la StartTextTranslationJoboperación.