Archivos de entrada de datos paralelos para Amazon Translate - Amazon Translate

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Archivos de entrada de datos paralelos para Amazon Translate

Antes de crear un recurso de datos paralelo en Amazon Translate, debe crear un archivo de entrada que contenga los ejemplos de traducción. El archivo de entrada de datos paralelo debe utilizar los idiomas compatibles con Amazon Translate. Para ver una lista de estos idiomas, consulteLenguajes y códigos de idioma admitidos.

Datos paralelos de ejemplo

El texto de la tabla siguiente proporciona ejemplos de segmentos de traducción a los que se puede dar formato a un archivo de entrada de datos paralelo:

en es zh

Amazon Translate es un servicio de traducción automática neuronal.

Amazon Translate es un servicio de traducción automática basada en redes neuronales.

Amazon Translate。

La traducción automática neuronal es una forma de automatización de la traducción de idiomas que utiliza modelos de aprendizaje profundo.

La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.

Amazon Translate te permite localizar contenido para usuarios internacionales.

Amazon Translate le permite localizar contenido para usuarios internacionales.

Amazon Translate

La primera fila de la tabla proporciona los códigos de idioma. El primer idioma, inglés (en), es el idioma de origen. El español (es) y el chino (zh) son los idiomas de destino. En la primera columna se proporcionan ejemplos de texto de origen. Las otras columnas contienen ejemplos de traducciones. Cuando estos datos paralelos personalizan un trabajo por lotes, Amazon Translate adapta la traducción para reflejar los ejemplos.

Formato de archivo de entrada

Amazon Translate admite los siguientes formatos para archivos de entrada de datos paralelos:

  • Translation Memory eXchange (TMX)

  • Valores separados por comas (CSV)

  • Valores separados por tabulaciones (TSV)

TMX

ejemplo Archivo de entrada TMX

En el siguiente archivo TMX de ejemplo se definen datos paralelos en un formato que Amazon Translate acepta. En este archivo, inglés (en) es el idioma de origen. Español (es) y Chino (zh) son los idiomas de destino. Como archivo de entrada para datos paralelos, proporciona varios ejemplos que Amazon Translate puede utilizar para adaptar la salida de un trabajo por lotes.

<?xml version="1.0" encoding="UTF-8"?> <tmx version="1.4"> <header srclang="en"/> <body> <tu> <tuv xml:lang="en"> <seg>Amazon Translate is a neural machine translation service.</seg> </tuv> <tuv xml:lang="es"> <seg>Amazon Translate es un servicio de traducción automática basado en redes neuronales.</seg> </tuv> <tuv xml:lang="zh"> <seg>Amazon Translate 是一项神经机器翻译服务。</seg> </tuv> </tu> <tu> <tuv xml:lang="en"> <seg>Neural machine translation is a form of language translation automation that uses deep learning models.</seg> </tuv> <tuv xml:lang="es"> <seg>La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.</seg> </tuv> <tuv xml:lang="zh"> <seg>神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。</seg> </tuv> </tu> <tu> <tuv xml:lang="en"> <seg>Amazon Translate allows you to localize content for international users.</seg> </tuv> <tuv xml:lang="es"> <seg>Amazon Translate le permite localizar contenido para usuarios internacionales.</seg> </tuv> <tuv xml:lang="zh"> <seg>Amazon Translate 允许您为国际用户本地化内容。</seg> </tuv> </tu> </body> </tmx>

Requisitos de TMX

Recuerde los siguientes requisitos de Amazon Translate al definir los datos paralelos en un archivo TMX:

  • Amazon Translate admite TMX 1.4b. Para obtener más información, consulte laEspecificación TMX 1.4ben el sitio web de la Asociación de Globalización y Localización.

  • Laheaderdebe incluir el elementosrclangatributo. El valor de este atributo determina el idioma de origen de los datos paralelos.

  • Labodydebe contener al menos una unidad de traducción (tu) elemento.

  • Cadatudebe contener al menos dos variantes de unidades de traducción (tuv) Elementos. Uno de estostuvLos elementos deben tener unxml:langatributo que tiene el mismo valor que el asignado alsrclangAtributo deheaderelemento.

  • TodostuvLos elementos deben tenerxml:langatributo.

  • Todostuvlos elementos deben tener un segmento (seg) elemento.

  • Al procesar el archivo de entrada, Amazon Translate omite ciertostuotuvelementos si se encuentrasegelementos que están vacíos o que contienen solo espacios en blanco:

    • Si el archivo desegcorresponde al idioma de origen, Amazon Translate omite eltuelemento que elsegel elemento ocupa.

    • Si el archivo desegcorresponde a un idioma de destino, Amazon Translate solo omite eltuvelemento que elsegel elemento ocupa.

  • Al procesar el archivo de entrada, Amazon Translate omite ciertostuotuvelementos si se encuentrasegelementos que superen los 1000 bytes:

    • Si el archivo desegcorresponde al idioma de origen, Amazon Translate omite eltuelemento que elsegel elemento ocupa.

    • Si el archivo desegcorresponde a un idioma de destino, Amazon Translate solo omite eltuvelemento que elsegel elemento ocupa.

  • Si el archivo de entrada contiene variostuElementos con el mismo texto de origen, Amazon Translate realiza una de las operaciones siguientes:

    • Si el archivo detulos elementos tienen elchangedate, utiliza el elemento con la fecha más reciente.

    • De lo contrario, utiliza el elemento que aparece más cerca del final del archivo.

CSV

En el siguiente archivo CSV de ejemplo se definen datos paralelos en un formato que Amazon Translate acepta. En este archivo, inglés (en) es el idioma de origen. Español (es) y Chino (zh) son los idiomas de destino. Como archivo de entrada para datos paralelos, proporciona varios ejemplos que Amazon Translate puede utilizar para adaptar la salida de un trabajo por lotes.

ejemplo Archivo de entrada CSV

en,es,zh Amazon Translate is a neural machine translation service.,Amazon Translate es un servicio de traducción automática basado en redes neuronales.,Amazon Translate 是一项神经机器翻译服务。 Neural machine translation is a form of language translation automation that uses deep learning models.,La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.,神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。 Amazon Translate allows you to localize content for international users.,Amazon Translate le permite localizar contenido para usuarios internacionales.,Amazon Translate 允许您为国际用户本地化内容。

Requisitos de CSV

Recuerde los siguientes requisitos de Amazon Translate al definir los datos paralelos en un archivo CSV:

  • La primera fila consiste en los códigos de idioma. El primer código es el idioma de origen y cada código posterior es un idioma de destino.

  • Cada campo de la primera columna contiene texto de origen. Cada campo de una columna posterior contiene una traducción de destino.

  • Si el texto de cualquier campo contiene una coma, el texto debe incluirse entre comillas dobles («).

  • Un campo de texto no puede abarcar varias líneas.

  • Los campos no pueden empezar con los siguientes caracteres: +, -, =, @. Este requisito se aplica independientemente de que el campo se encuentre entre comillas dobles («) o no.

  • Si el texto de un campo contiene una comilla doble («), debe escaparse con una comilla doble. Por ejemplo, texto como:

    34" monitor

    Debe escribirse de la siguiente manera:

    34"" monitor
  • Al procesar el archivo de entrada, Amazon Translate omitirá ciertas líneas o campos si encuentra campos vacíos o que solo contienen espacios en blanco:

    • Si un campo de texto de origen está vacío, Amazon Translate omite la línea que ocupa.

    • Si un campo de traducción de destino está vacío, Amazon Translate omite solo ese campo.

  • Al procesar el archivo de entrada, Amazon Translate omite ciertas líneas o campos si encuentra campos que superan los 1000 bytes:

    • Si un campo de texto de origen supera el límite de bytes, Amazon Translate omite la línea que ocupa.

    • Si un campo de traducción de destino supera el límite de bytes, Amazon Translate solo omite ese campo.

  • Si el archivo de entrada contiene varios registros con el mismo texto de origen, Amazon Translate utiliza el registro que se produce más cerca del final del archivo.

TSV

En el siguiente archivo TSV de ejemplo se definen datos paralelos en un formato que Amazon Translate acepta. En este archivo, inglés (en) es el idioma de origen. Español (es) y Chino (zh) son los idiomas de destino. Como archivo de entrada para datos paralelos, proporciona varios ejemplos que Amazon Translate puede utilizar para adaptar la salida de un trabajo por lotes.

ejemplo Archivo de entrada TSV

en es zh Amazon Translate is a neural machine translation service. Amazon Translate es un servicio de traducción automática basado en redes neuronales. Amazon Translate 是一项神经机器翻译服务。 Neural machine translation is a form of language translation automation that uses deep learning models. La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo. 神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。 Amazon Translate allows you to localize content for international users. Amazon Translate le permite localizar contenido para usuarios internacionales. Amazon Translate 允许您为国际用户本地化内容。

Requisitos TSV

Recuerde los siguientes requisitos de Amazon Translate al definir los datos paralelos en un archivo TSV:

  • La primera fila consiste en los códigos de idioma. El primer código es el idioma de origen y cada código posterior es un idioma de destino.

  • Cada campo de la primera columna contiene texto de origen. Cada campo de una columna posterior contiene una traducción de destino.

  • Si el texto de cualquier campo contiene un carácter de tabulación, el texto debe incluirse entre comillas dobles («).

  • Un campo de texto no puede abarcar varias líneas.

  • Los campos no pueden empezar con los siguientes caracteres: +, -, =, @. Este requisito se aplica independientemente de que el campo se encuentre entre comillas dobles («) o no.

  • Si el texto de un campo contiene una comilla doble («), debe escaparse con una comilla doble. Por ejemplo, texto como:

    34" monitor

    Debe escribirse de la siguiente manera:

    34"" monitor
  • Al procesar el archivo de entrada, Amazon Translate omite ciertas líneas o campos si encuentra campos vacíos o que solo contienen espacios en blanco:

    • Si un campo de texto de origen está vacío, Amazon Translate omite la línea que ocupa.

    • Si un campo de traducción de destino está vacío, Amazon Translate omite solo ese campo.

  • Al procesar el archivo de entrada, Amazon Translate omite ciertas líneas o campos si encuentra campos que superan los 1000 bytes:

    • Si un campo de texto de origen supera el límite de bytes, Amazon Translate omite la línea que ocupa.

    • Si un campo de traducción de destino supera el límite de bytes, Amazon Translate solo omite ese campo.

  • Si el archivo de entrada contiene varios registros con el mismo texto de origen, Amazon Translate utiliza el registro que se produce más cerca del final del archivo.