Fichiers de saisie de données parallèles pour Amazon Translate - Amazon Translate

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Fichiers de saisie de données parallèles pour Amazon Translate

Avant de créer une ressource de données parallel dans Amazon Translate, vous devez créer un fichier d'entrée contenant vos exemples de traduction. Votre fichier d'entrée de données parallel doit utiliser des langues prises en charge par Amazon Translate. Pour consulter une liste de ces langages, consultezLangues et codes de langue pris en charge.

Exemple de données en parallel

Le texte du tableau suivant fournit des exemples de segments de traduction qui peuvent être formatés dans un fichier d'entrée de données parallel :

en es zh

Amazon Translate est un service de traduction automatique neuronale.

Amazon Translate est un servicio de traducción automática basado en redes neuronales.

Amazon Translate。

La traduction automatique neuronale est une forme d'automatisation de la traduction linguistique qui utilise des modèles d'apprentissage en profondeur.

La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.

,,。

Amazon Translate vous permet de localiser du contenu pour les utilisateurs internationaux.

Amazon Translate le permis localizar contenido para usuarios internacionales.

Amazon Translate。

La première ligne du tableau fournit les codes de langue. La première langue, l'anglais (en), est la langue source. L'espagnol (es) et le chinois (zh) sont les langues cibles. La première colonne fournit des exemples de texte source. Les autres colonnes contiennent des exemples de traductions. Lorsque ces données parallel personnalisent une tâche par lots, Amazon Translate adapte la traduction pour refléter les exemples.

Format de fichier d'entrée

Amazon Translate prend en charge les formats suivants pour les fichiers d'entrée de données parallel :

  • Mémoire de traduction eXchange (TMX)

  • Valeurs séparées par des virgules (CSV)

  • Valeurs séparées par des tabulations (TSV)

TMX

Exemple Fichier d'entrée TMX

L'exemple de fichier TMX suivant définit des données parallel dans un format accepté par Amazon Translate. Dans ce dossier, l'anglais (en) est la langue source. Espagnol (es) et en chinois (zh) sont les langues cibles. En tant que fichier d'entrée pour les données parallel, il fournit plusieurs exemples qu'Amazon Translate peut utiliser pour personnaliser la sortie d'un traitement par lots.

<?xml version="1.0" encoding="UTF-8"?> <tmx version="1.4"> <header srclang="en"/> <body> <tu> <tuv xml:lang="en"> <seg>Amazon Translate is a neural machine translation service.</seg> </tuv> <tuv xml:lang="es"> <seg>Amazon Translate es un servicio de traducción automática basado en redes neuronales.</seg> </tuv> <tuv xml:lang="zh"> <seg>Amazon Translate 是一项神经机器翻译服务。</seg> </tuv> </tu> <tu> <tuv xml:lang="en"> <seg>Neural machine translation is a form of language translation automation that uses deep learning models.</seg> </tuv> <tuv xml:lang="es"> <seg>La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.</seg> </tuv> <tuv xml:lang="zh"> <seg>神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。</seg> </tuv> </tu> <tu> <tuv xml:lang="en"> <seg>Amazon Translate allows you to localize content for international users.</seg> </tuv> <tuv xml:lang="es"> <seg>Amazon Translate le permite localizar contenido para usuarios internacionales.</seg> </tuv> <tuv xml:lang="zh"> <seg>Amazon Translate 允许您为国际用户本地化内容。</seg> </tuv> </tu> </body> </tmx>
Exigences du TMX

N'oubliez pas les exigences suivantes d'Amazon Translate lorsque vous définissez vos données parallel dans un fichier TMX :

  • Amazon Translate prend en charge le format TMX 1.4b. Pour de plus amples informations, veuillez consulter le .Spécification TMX 1.4bsur le site Web de la Globalization and Localization Association.

  • Dans laheaderl'élément doit incluresrclangAttribut. La valeur de cet attribut détermine la langue source des données parallel.

  • Dans labodyl'Élément doit comprendre au moins une unité de traduction (tuÉlément).

  • Chacuntul'élément doit contenir au moins deux variantes d'unités de traduction (tuv) Éléments. L'un d'entre euxtuvles éléments doivent avoir unexml:langattribut ayant la même valeur que celui attribué àsrclangAttribut dansheaderÉlément.

  • Toustuvles éléments doivent avoir la valeurxml:langAttribut.

  • Toustuvles éléments doivent avoir un segment (segÉlément).

  • Lors du traitement de votre fichier d'entrée, Amazon Translate ignore certainstuoutuvéléments s'il rencontresegéléments vides ou contenant uniquement des espaces blancs :

    • Si l'icônesegl'élément correspond à la langue source, Amazon Translate ignore letuÉlément quesegÉlément occupe.

    • Si l'icônesegl'élément correspond à une langue cible, Amazon Translate ignore uniquement letuvÉlément quesegÉlément occupe.

  • Lors du traitement de votre fichier d'entrée, Amazon Translate ignore certainstuoutuvéléments s'il rencontresegéléments dépassant 1 000 octets :

    • Si l'icônesegl'élément correspond à la langue source, Amazon Translate ignore letuÉlément quesegÉlément occupe.

    • Si l'icônesegl'élément correspond à une langue cible, Amazon Translate ignore uniquement letuvÉlément quesegÉlément occupe.

  • Si le fichier d'entrée contient plusieurstuÉléments avec le même texte source, Amazon Translate effectue l'une des opérations suivantes :

    • Si l'icônetules éléments ont lechangedateattribut, il utilise l'élément dont la date est la plus récente.

    • Sinon, il utilise l'élément qui se trouve le plus près de la fin du fichier.

CSV

L'exemple de fichier CSV suivant définit des données parallel dans un format accepté par Amazon Translate. Dans ce dossier, l'anglais (en) est la langue source. Espagnol (es) et en chinois (zh) sont les langues cibles. En tant que fichier d'entrée pour les données parallel, il fournit plusieurs exemples qu'Amazon Translate peut utiliser pour personnaliser la sortie d'un traitement par lots.

Exemple Fichier d'entrée CSV
en,es,zh Amazon Translate is a neural machine translation service.,Amazon Translate es un servicio de traducción automática basado en redes neuronales.,Amazon Translate 是一项神经机器翻译服务。 Neural machine translation is a form of language translation automation that uses deep learning models.,La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.,神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。 Amazon Translate allows you to localize content for international users.,Amazon Translate le permite localizar contenido para usuarios internacionales.,Amazon Translate 允许您为国际用户本地化内容。
Exigences du CSV

N'oubliez pas les exigences suivantes d'Amazon Translate lorsque vous définissez vos données parallel dans un fichier CSV :

  • La première ligne contient les codes de langue. Le premier code est la langue source et chaque code suivant est une langue cible.

  • Chaque champ de la première colonne contient le texte source. Chaque champ d'une colonne suivante contient une traduction cible.

  • Si le texte d'un champ contient une virgule, le texte doit être placé entre guillemets doubles («).

  • Un champ de texte ne peut pas s'étendre sur plusieurs lignes.

  • Les champs ne peuvent pas commencer par les caractères suivants : +, -, =, @. Cette exigence s'applique que le champ soit placé entre guillemets («) ou non.

  • Si le texte d'un champ contient un guillemet double («), il doit être séparé par un guillemet double. Par exemple, du texte tel que :

    34" monitor

    Doit être écrit comme suit :

    34"" monitor
  • Lors du traitement de votre fichier d'entrée, Amazon Translate ignorera certaines lignes ou certains champs s'il rencontre des champs vides ou contenant uniquement des espaces :

    • Si un champ de texte source est vide, Amazon Translate ignore la ligne qu'il occupe.

    • Si un champ de traduction cible est vide, Amazon Translate ignore uniquement ce champ.

  • Lors du traitement de votre fichier d'entrée, Amazon Translate ignore certaines lignes ou certains champs s'il rencontre des champs dépassant 1 000 octets :

    • Si un champ de texte source dépasse la limite d'octets, Amazon Translate ignore la ligne qu'il occupe.

    • Si un champ de traduction cible dépasse la limite d'octets, Amazon Translate ignore uniquement ce champ.

  • Si le fichier d'entrée contient plusieurs enregistrements avec le même texte source, Amazon Translate utilise l'enregistrement qui se trouve le plus près de la fin du fichier.

TSV

L'exemple de fichier TSV suivant définit des données parallel dans un format accepté par Amazon Translate. Dans ce dossier, l'anglais (en) est la langue source. Espagnol (es) et en chinois (zh) sont les langues cibles. En tant que fichier d'entrée pour les données parallel, il fournit plusieurs exemples qu'Amazon Translate peut utiliser pour personnaliser la sortie d'un traitement par lots.

Exemple Fichier d'entrée TSV
en es zh Amazon Translate is a neural machine translation service. Amazon Translate es un servicio de traducción automática basado en redes neuronales. Amazon Translate 是一项神经机器翻译服务。 Neural machine translation is a form of language translation automation that uses deep learning models. La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo. 神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。 Amazon Translate allows you to localize content for international users. Amazon Translate le permite localizar contenido para usuarios internacionales. Amazon Translate 允许您为国际用户本地化内容。
Exigences TSV

N'oubliez pas les exigences suivantes d'Amazon Translate lorsque vous définissez vos données parallel dans un fichier TSV :

  • La première ligne contient les codes de langue. Le premier code est la langue source et chaque code suivant est une langue cible.

  • Chaque champ de la première colonne contient le texte source. Chaque champ d'une colonne suivante contient une traduction cible.

  • Si le texte d'un champ contient un caractère de tabulation, le texte doit être placé entre guillemets doubles («).

  • Un champ de texte ne peut pas s'étendre sur plusieurs lignes.

  • Les champs ne peuvent pas commencer par les caractères suivants : +, -, =, @. Cette exigence s'applique que le champ soit placé entre guillemets («) ou non.

  • Si le texte d'un champ contient un guillemet double («), il doit être séparé par un guillemet double. Par exemple, du texte tel que :

    34" monitor

    Doit être écrit comme suit :

    34"" monitor
  • Lors du traitement de votre fichier d'entrée, Amazon Translate ignore certaines lignes ou certains champs s'il rencontre des champs vides ou contenant uniquement des espaces :

    • Si un champ de texte source est vide, Amazon Translate ignore la ligne qu'il occupe.

    • Si un champ de traduction cible est vide, Amazon Translate ignore uniquement ce champ.

  • Lors du traitement de votre fichier d'entrée, Amazon Translate ignore certaines lignes ou certains champs s'il rencontre des champs dépassant 1 000 octets :

    • Si un champ de texte source dépasse la limite d'octets, Amazon Translate ignore la ligne qu'il occupe.

    • Si un champ de traduction cible dépasse la limite d'octets, Amazon Translate ignore uniquement ce champ.

  • Si le fichier d'entrée contient plusieurs enregistrements avec le même texte source, Amazon Translate utilise l'enregistrement qui se trouve le plus près de la fin du fichier.