Exécution d'une tâche de traduction par lots - Amazon Translate

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Exécution d'une tâche de traduction par lots

Vous pouvez exécuter une tâche de traduction par lots à l'aide de la console Amazon Translate, de l'AWS CLIAPI Amazon Translate ou de l'API Amazon Translate.

Note

Les tâches de traduction par lots sont des opérations qui peuvent prendre beaucoup de temps. Par exemple, la traduction par lots d'un petit ensemble de données peut prendre quelques minutes, tandis que de très grands ensembles de données peuvent prendre jusqu'à 2 jours ou plus. Le délai de réalisation dépend également de la disponibilité des ressources.

Pour exécuter une tâche de traduction à l'aide de la console Amazon Translate, utilisez la page de traduction Batch pour créer la tâche :

  1. Ouvrez la console Amazon Translate.

  2. Dans le menu de navigation de gauche, choisissez Batch translation.

  3. Sur la page Tâches de traduction, choisissez Créer une tâche. La console affiche la page Créer une tâche de traduction.

  4. Sous Paramètres du Job, procédez comme suit :

    1. Dans Nom, entrez un nom personnalisé pour la tâche de traduction par lots.

    2. Pour Langue source, sélectionnez la langue des fichiers source. Si vous ne connaissez pas la langue des fichiers source ou si vos documents d'entrée contiennent différentes langues source, sélectionnezauto. Amazon Translate détecte automatiquement la langue source de chaque fichier.

    3. Pour les langues cibles, sélectionnez jusqu'à 10 langues. Amazon Translate traduit chaque fichier source dans chaque langue cible.

  5. Sous Données d'entrée, procédez comme suit :

    1. Pour l'emplacement d'entrée S3, spécifiez le dossier d'entrée qui contient les fichiers source de traduction dans Amazon S3. Pour fournir le dossier en accédant à celui-ci dans Amazon S3, choisissez Select folder.

    2. Pour Format de fichier, sélectionnez le format des fichiers source de traduction.

  6. Sous Données de sortie, procédez comme suit :

    1. Pour l'emplacement de la sortie S3, spécifiez le dossier de sortie dans Amazon S3 où Amazon Translate place la sortie de traduction. Pour fournir le dossier en accédant à celui-ci dans Amazon S3, choisissez Select folder.

    2. Vous pouvez également choisir Personnaliser les paramètres de chiffrement (avancés) si vous souhaitez chiffrer votre sortie avec une clé gérée par le client que vous gérez dans le AWS Key Management Service (AWS KMS).

      Par défaut, Amazon Translate chiffre votre sortie de traduction à l'aide d'une clé KMS créée, gérée et utilisée en votre nom parAWS. Choisissez cette option si vous souhaitez plutôt chiffrer votre sortie avec votre propre clé KMS.

      Si vous souhaitez utiliser une clé KMS du AWS compte actuel, sélectionnez-la sous Choisir une AWS Key Management Service clé. Ou, si vous souhaitez utiliser une clé KMS provenant d'un autre compte AWS, entrez le Amazon Resource Name (ARN) pour cette clé.

      Note

      Avant de pouvoir utiliser votre propre clé KMS, vous devez ajouter des autorisations au rôle de service pour Amazon Translate dans IAM. Si vous souhaitez utiliser une clé KMS provenant d'un autre compte, vous devez également mettre à jour la politique des clés dansAWS KMS. Pour en savoir plus, consultez Autorisations prérequises pour personnaliser le chiffrement.

  7. Sous Personnalisations (facultatif), vous pouvez choisir de personnaliser le résultat de votre travail de traduction avec les paramètres suivants :

    Blasphème

    Masque les mots et les phrases profanes dans le résultat de votre traduction. Si vous spécifiez plusieurs langues cibles pour le travail, toutes les langues cibles doivent prendre en charge le masquage des grossièretés. Si l'une des langues cibles ne prend pas en charge le masquage grossier, le travail de traduction ne masquera aucun blasphème pour aucune langue cible.

    Pour en savoir plus, consultez Masquer des mots et des phrases profanes dans Amazon Translate.

    Brièveté

    Amazon Translate ne prend pas en charge la brièveté pour les tâches de traduction par lots.

    Pour en savoir plus, consultez Utiliser la brièveté dans Amazon Translate.

    Formalité

    Pour certaines langues cibles, vous pouvez définir Formality sur formel ou informel. Si vous spécifiez plusieurs langues cibles pour le travail, translate ignore le paramètre de formalité pour toute langue cible non prise en charge.

    Pour en savoir plus, consultez Configuration de la formalité dans Amazon Translate.

    Terminologie personnalisée

    Comprend des exemples de termes sources et la traduction souhaitée pour chaque terme. Si vous spécifiez plusieurs langues cibles pour le travail, translate utilise la terminologie désignée pour chaque langue cible demandée qui comporte une entrée pour le terme source dans le fichier terminologique.

    Pour en savoir plus, consultez Personnalisation de vos traductions avec une terminologie personnalisée.

    Données parallèles

    Comprend des exemples qui montrent comment vous souhaitez que des segments de texte soient traduits. Si vous spécifiez plusieurs langues cibles pour la tâche, le fichier de données parallèle doit inclure les traductions pour toutes les langues cibles.

    Lorsque vous ajoutez des données parallèles à une tâche de traduction par lots, vous créez une tâche de traduction personnalisée active.

    Note

    Les tâches de traduction personnalisée actives sont facturées plus cher que les autres tâches qui n'utilisent pas de données parallèles. Pour plus d'informations, consultez les tarifs d'Amazon Translate.

    Pour en savoir plus, consultez Personnalisation de vos traductions avec des données parallel (Active Custom Translation).

  8. Sous Autorisations d'accès, attribuez à Amazon Translate un rôle IAM qui accorde les autorisations requises à vos fichiers d'entrée et de sortie dans Amazon S3 :

    • Si vous avez déjà ce rôle IAM dans votre compte, choisissez Utiliser un rôle IAM existant, puis sélectionnez-le sous Rôle IAM.

    • Si vous ne possédez pas encore ce rôle IAM dans votre compte, choisissez Créer un rôle IAM. Pour le rôle IAM, choisissez les compartiments S3 d'entrée et de sortie. Pour Nom du rôle, entrez un nom personnalisé. Lorsque vous créez la tâche de traduction, Amazon Translate crée automatiquement le rôle. Le nom du rôle dans IAM est préfixé par AmazonTranslateServiceRole -.

      Note

      Si vous avez choisi de chiffrer votre sortie de traduction avec votre propre clé KMS, vous ne pouvez pas choisir Créer un rôle IAM. Dans ce cas, vous devez utiliser un rôle IAM préexistant, et votre clé KMS doit avoir une politique de clé qui autorise le rôle à utiliser la clé.

      Pour plus d’informations, consultez Autorisations prérequises pour personnaliser le chiffrement.

  9. Choisissez Créer une tâche.

    La console revient à la page Tâches de traduction, où le statut de création des tâches est affiché dans une bannière en haut de la page. Après quelques minutes, votre tâche apparaît dans le tableau.

  10. Choisissez le nom de la tâche dans la colonne Nom pour ouvrir la page des détails de la tâche.

    Pendant l'exécution de votre travail de traduction, le champ État indique En cours.

  11. Lorsque le statut devient Terminé, accédez à votre sortie de traduction en cliquant sur le lien sous Emplacement du fichier de sortie. La console accède à votre compartiment de sortie dans Amazon S3.

  12. Pour télécharger vos fichiers de sortie, cochez la case correspondante, puis choisissez Télécharger.

Pour exécuter une tâche de traduction à l'aide deAWS CLI, utilisez la start-text-translation-jobcommande et spécifiez le nom de votre ressource de données parallèle pour le parallel-data-names paramètre.

Exemple tart-text-translation-job Commande S

L'exemple suivant exécute une tâche de traduction en soumettant un fichier Excel stocké dans un compartiment d'entrée dans Amazon S3. Cette tâche est personnalisée en fonction des données parallèles incluses dans la demande.

$ aws translate start-text-translation-job \ > --input-data-config ContentType=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet,S3Uri=s3://my-s3-bucket/input/ \ > --output-data-config S3Uri=s3://my-s3-bucket/output/ \ > --data-access-role-arn arn:aws:iam::111122223333:role/my-iam-role \ > --source-language-code en \ > --target-language-codes es it \ > --job-name my-translation-job

Si la commande aboutit, Amazon Translate répond en indiquant l'ID et le statut de la tâche :

{ "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobStatus": "SUBMITTED" }

Si vous souhaitez personnaliser le résultat de votre travail de traduction, vous pouvez utiliser les paramètres suivants :

--settings

Paramètres permettant de configurer votre sortie de traduction, notamment les options suivantes :

Activez la brièveté dans la sortie de traduction. Amazon Translate ne prend pas en charge la brièveté pour les tâches de traduction par lots. Pour en savoir plus, consultez Utiliser la brièveté dans Amazon Translate.

Activez les grossièretés pour masquer les mots et expressions profanes. Pour l'activer, définissez le paramètre blasphématoire sur. Profanity=MASK Pour en savoir plus, consultez Masquer des mots et des phrases profanes dans Amazon Translate. Si l'une des langues cibles ne prend pas en charge le masquage grossier, le travail de traduction ne masquera aucun blasphème pour aucune langue cible.

Définissez le niveau de formalité de la sortie de traduction. Définissez le Formality paramètre sur FORMAL ouINFORMAL. Si vous spécifiez plusieurs langues cibles pour le travail, translate ignore le paramètre de formalité pour toute langue cible non prise en charge. Pour en savoir plus, consultez Configuration de la formalité dans Amazon Translate.

--terminology-names

Le nom d'une ressource terminologique personnalisée à ajouter à la tâche de traduction. Cette ressource répertorie des exemples de termes sources et la traduction souhaitée pour chaque terme. Si vous spécifiez plusieurs langues cibles pour le travail, translate utilise la terminologie désignée pour chaque langue cible demandée qui comporte une entrée pour le terme source dans le fichier terminologique.

Ce paramètre n'accepte qu'une seule ressource terminologique personnalisée.

Pour obtenir la liste des ressources terminologiques personnalisées disponibles, utilisez la list-terminologiescommande.

Pour en savoir plus, consultez Personnalisation de vos traductions avec une terminologie personnalisée.

--parallel-data-names

Nom d'une ressource de données parallèle à ajouter à la tâche de traduction. Cette ressource contient des exemples qui montrent comment vous souhaitez que des segments de texte soient traduits. Si vous spécifiez plusieurs langues cibles pour la tâche, le fichier de données parallèle doit inclure les traductions pour toutes les langues cibles.

Lorsque vous ajoutez des données parallèles à une tâche de traduction, vous créez une tâche de traduction personnalisée active.

Ce paramètre n'accepte qu'une seule ressource de données parallèle.

Note

Les tâches de traduction personnalisée actives sont facturées plus cher que les autres tâches qui n'utilisent pas de données parallèles. Pour plus d'informations, consultez les tarifs d'Amazon Translate.

Pour obtenir la liste des ressources de données parallèles disponibles, utilisez la list-parallel-datacommande.

Pour en savoir plus, consultez Personnalisation de vos traductions avec des données parallel (Active Custom Translation).

Pour vérifier l'état de votre travail de traduction, utilisez la describe-text-translation-jobcommande.

Exemple escribe-text-translation-job commande D

L'exemple suivant vérifie le statut de la tâche en fournissant l'ID de la tâche. Cet identifiant a été fourni par Amazon Translate lorsque la tâche a été lancée par la start-text-translation-job commande.

$ aws translate describe-text-translation-job \ > --job-id 4446f95f20c88a4b347449d3671fbe3d

Amazon Translate répond en indiquant les propriétés de la tâche, notamment son statut :

{ "TextTranslationJobProperties": { "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobName": "my-translation-job", "JobStatus": "COMPLETED", "JobDetails": { "TranslatedDocumentsCount": 0, "DocumentsWithErrorsCount": 0, "InputDocumentsCount": 1 }, "SourceLanguageCode": "en", "TargetLanguageCodes": [ "es", "it" ], "SubmittedTime": 1598661012.468, "InputDataConfig": { "S3Uri": "s3://my-s3-bucket/input/", "ContentType": "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet" }, "OutputDataConfig": { "S3Uri": "s3://my-s3-bucket/output/111122223333-TranslateText-4446f95f20c88a4b347449d3671fbe3d/" }, "DataAccessRoleArn": "arn:aws:iam::111122223333:role/my-iam-role" } }

Si la JobStatus valeur est la IN_PROGRESS même, attendez quelques minutes et describe-text-translation-jobrecommencez jusqu'à ce que le statut soit rétabliCOMPLETED. Une fois le travail terminé, vous pouvez télécharger les résultats de la traduction à l'emplacement indiqué S3Uri dans le champ ci-dessousOutputDataConfig.

Pour soumettre une tâche de traduction par lots à l'aide de l'API Amazon Translate, utilisez l'StartTextTranslationJobopération.