Esecuzione di un processo di traduzione in batch - Amazon Translate

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Esecuzione di un processo di traduzione in batch

Puoi eseguire un processo di traduzione in batch utilizzando la console Amazon Translate AWS CLI, o l'API Amazon Translate.

Nota

I processi di traduzione batch sono operazioni di lunga durata e possono richiedere molto tempo per essere completati. Ad esempio, la traduzione in batch su un set di dati di piccole dimensioni potrebbe richiedere alcuni minuti, mentre set di dati molto grandi potrebbero richiedere fino a 2 giorni o più. Il tempo di completamento dipende anche dalla disponibilità delle risorse.

Per eseguire un lavoro di traduzione utilizzando la console Amazon Translate, utilizza la pagina di traduzione Batch per creare il lavoro:

  1. Apri la console Amazon Translate.

  2. Nel menu di navigazione a sinistra, scegli Traduzione in Batch.

  3. Nella pagina Lavori di traduzione, scegli Crea lavoro. La console mostra la pagina Crea lavoro di traduzione.

  4. In Impostazioni Job, effettuate le seguenti operazioni:

    1. In Nome, inserite un nome personalizzato per il lavoro di traduzione in batch.

    2. Per Lingua di origine, selezionate la lingua dei file sorgente. Se non conosci la lingua dei file sorgente o se i documenti di input contengono lingue di origine diverse, selezionaauto. Amazon Translate rileva automaticamente la lingua di origine per ogni file.

    3. Per le lingue di destinazione, seleziona fino a 10 lingue. Amazon Translate traduce ogni file sorgente in ogni lingua di destinazione.

  5. In Dati di input, procedi come segue:

    1. Per la posizione di Input S3, specifica la cartella di input che contiene i file sorgente di traduzione in Amazon S3. Per fornire la cartella accedendovi in Amazon S3, scegli Seleziona cartella.

    2. Per Formato file, seleziona il formato dei file sorgente della traduzione.

  6. In Dati di output, procedi come segue:

    1. Per la posizione Output S3, specifica la cartella di output in Amazon S3 in cui Amazon Translate inserisce l'output della traduzione. Per fornire la cartella accedendovi in Amazon S3, scegli Seleziona cartella.

    2. Facoltativamente, scegli Personalizza le impostazioni di crittografia (avanzate) se desideri crittografare l'output con una chiave gestita dal cliente che gestisci in (). AWS Key Management Service AWS KMS

      Per impostazione predefinita, Amazon Translate crittografa l'output di traduzione utilizzando una chiave KMS creata, gestita e utilizzata per tuo conto da. AWS Scegli questa opzione se desideri invece crittografare l'output con la tua chiave KMS.

      Se desideri utilizzare una chiave KMS dell' AWS account corrente, selezionala in Scegli una chiave. AWS Key Management Service Oppure, se desideri utilizzare una chiave KMS da un altro account AWS, inserisci l'Amazon Resource Name (ARN) per quella chiave.

      Nota

      Prima di poter utilizzare la tua chiave KMS, devi aggiungere le autorizzazioni al ruolo di servizio per Amazon Translate in IAM. Se desideri utilizzare una chiave KMS di un altro account, devi anche aggiornare la politica delle chiavi in. AWS KMS Per ulteriori informazioni, consulta Autorizzazioni prerequisite per personalizzare la crittografia.

  7. In Personalizzazioni - opzionale, puoi scegliere di personalizzare l'output del tuo lavoro di traduzione con le seguenti impostazioni:

    Volgarità

    Maschera parole e frasi profane nel risultato della traduzione. Se specificate più lingue di destinazione per il lavoro, tutte le lingue di destinazione devono supportare il mascheramento delle parolacce. Se una delle lingue di destinazione non supporta il mascheramento di volgarità, il lavoro di traduzione non maschererà il mascheramento delle parolacce per nessuna lingua di destinazione.

    Per ulteriori informazioni, consulta Mascherare parole e frasi profane in Amazon Translate.

    Brevità

    Amazon Translate non supporta la brevità per i lavori di traduzione in batch.

    Per ulteriori informazioni, consulta Usare la brevità in Amazon Translate.

    Formalità

    Per alcune lingue di destinazione, puoi impostare Formalità su formale o informale. Se si specificano più lingue di destinazione per il lavoro, translate ignora l'impostazione di formalità per qualsiasi lingua di destinazione non supportata.

    Per ulteriori informazioni, consulta Impostazione della formalità in Amazon Translate.

    Terminologia personalizzata

    È costituita da termini di origine di esempio e dalla traduzione desiderata per ogni termine. Se si specificano più lingue di destinazione per il lavoro, translate utilizza la terminologia designata per ogni lingua di destinazione richiesta che contiene una voce per il termine di origine nel file terminologico.

    Per ulteriori informazioni, consulta Personalizzazione delle traduzioni con una terminologia personalizzata.

    Dati paralleli

    È costituito da esempi che mostrano come desiderate che i segmenti di testo vengano tradotti. Se si specificano più lingue di destinazione per il lavoro, il file di dati parallelo deve includere le traduzioni per tutte le lingue di destinazione.

    Quando si aggiungono dati paralleli a un lavoro di traduzione in batch, si crea un lavoro di traduzione personalizzato attivo.

    Nota

    I lavori di traduzione personalizzata attivi hanno un prezzo più elevato rispetto ad altri lavori che non utilizzano dati paralleli. Per ulteriori informazioni, consulta i prezzi di Amazon Translate.

    Per ulteriori informazioni, consulta Personalizzazione delle traduzioni con dati parallel (traduzione personalizzata attiva).

  8. In Autorizzazioni di accesso, fornisci ad Amazon Translate un ruolo IAM che conceda le autorizzazioni necessarie per i tuoi file di input e output in Amazon S3:

    • Se hai già questo ruolo IAM nel tuo account, scegli Usa un ruolo IAM esistente e selezionalo in Ruolo IAM.

    • Se non hai già questo ruolo IAM nel tuo account, scegli Crea un ruolo IAM. Per il ruolo IAM, scegli i bucket S3 di input e output. Per il nome del ruolo, fornisci un nome personalizzato. Quando crei il lavoro di traduzione, Amazon Translate crea il ruolo automaticamente. Il nome del ruolo in IAM ha il prefisso AmazonTranslateServiceRole-.

      Nota

      Se hai scelto di crittografare l'output della traduzione con la tua chiave KMS, non puoi scegliere Crea un ruolo IAM. In questo caso, devi utilizzare un ruolo IAM preesistente e la tua chiave KMS deve avere una policy chiave che consenta al ruolo di utilizzare la chiave.

      Per ulteriori informazioni, consulta Autorizzazioni prerequisite per personalizzare la crittografia

  9. Scegli Crea processo.

    La console torna alla pagina Translation jobs, dove lo stato di creazione del lavoro viene mostrato in un banner nella parte superiore della pagina. Dopo alcuni minuti, il lavoro viene visualizzato nella tabella.

  10. Scegli il nome del lavoro nella colonna Nome per aprire la pagina dei dettagli del lavoro.

    Durante l'esecuzione del processo di traduzione, il campo Stato mostra In corso.

  11. Quando lo stato diventa Completato, accedi all'output della traduzione scegliendo il link sotto Posizione del file di output. La console va al tuo bucket di output in Amazon S3.

  12. Per scaricare i file di output, seleziona la casella di controllo corrispondente e scegli Scarica.

Per eseguire un lavoro di traduzione utilizzando AWS CLI, utilizzate il start-text-translation-jobcomando e specificate il nome della risorsa dati parallela per il parallel-data-names parametro.

Esempio tart-text-translation-job Comando S

L'esempio seguente esegue un processo di traduzione inviando un file Excel archiviato in un bucket di input in Amazon S3. Questo lavoro è personalizzato dai dati paralleli inclusi nella richiesta.

$ aws translate start-text-translation-job \ > --input-data-config ContentType=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet,S3Uri=s3://DOC-EXAMPLE-BUCKET/input/ \ > --output-data-config S3Uri=s3://DOC-EXAMPLE-BUCKET/output/ \ > --data-access-role-arn arn:aws:iam::111122223333:role/my-iam-role \ > --source-language-code en \ > --target-language-codes es it \ > --job-name my-translation-job

Se il comando ha esito positivo, Amazon Translate risponde con l'ID e lo stato del lavoro:

{ "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobStatus": "SUBMITTED" }

Se desideri personalizzare l'output del tuo lavoro di traduzione, puoi utilizzare i seguenti parametri:

--settings

Impostazioni per configurare l'output della traduzione, incluse le seguenti opzioni:

Attiva la brevità nell'output di traduzione. Amazon Translate non supporta la brevità per i lavori di traduzione in batch. Per ulteriori informazioni, consulta Usare la brevità in Amazon Translate.

Abilita le parolacce per mascherare parole e frasi profane. Per abilitarlo, imposta il parametro volgarità su. Profanity=MASK Per ulteriori informazioni, consulta Mascherare parole e frasi profane in Amazon Translate. Se una delle lingue di destinazione non supporta il mascheramento delle parolacce, il lavoro di traduzione non maschererà le parolacce per nessuna lingua di destinazione.

Imposta il livello di formalità nell'output della traduzione. Imposta il Formality parametro su FORMAL oINFORMAL. Se specificate più lingue di destinazione per il lavoro, translate ignora l'impostazione della formalità per qualsiasi lingua di destinazione non supportata. Per ulteriori informazioni, consulta Impostazione della formalità in Amazon Translate.

--terminology-names

Il nome di una risorsa terminologica personalizzata da aggiungere al lavoro di traduzione. Questa risorsa elenca i termini di origine di esempio e la traduzione desiderata per ogni termine. Se si specificano più lingue di destinazione per il lavoro, translate utilizza la terminologia designata per ogni lingua di destinazione richiesta che contiene una voce per il termine di origine nel file terminologico.

Questo parametro accetta solo una risorsa terminologica personalizzata.

Per un elenco delle risorse terminologiche personalizzate disponibili, utilizzare il list-terminologiescomando.

Per ulteriori informazioni, consulta Personalizzazione delle traduzioni con una terminologia personalizzata.

--parallel-data-names

Il nome di una risorsa di dati parallela da aggiungere al lavoro di traduzione. Questa risorsa è composta da esempi che mostrano come desiderate che i segmenti di testo vengano tradotti. Se si specificano più lingue di destinazione per il lavoro, il file di dati parallelo deve includere le traduzioni per tutte le lingue di destinazione.

Quando aggiungi dati paralleli a un lavoro di traduzione, crei un lavoro di traduzione personalizzato attivo.

Questo parametro accetta solo una risorsa dati parallela.

Nota

I lavori di traduzione personalizzata attivi hanno un prezzo più elevato rispetto ad altri lavori che non utilizzano dati paralleli. Per ulteriori informazioni, consulta i prezzi di Amazon Translate.

Per un elenco delle risorse di dati parallele disponibili, utilizzare il list-parallel-datacomando.

Per ulteriori informazioni, consulta Personalizzazione delle traduzioni con dati parallel (traduzione personalizzata attiva).

Per controllare lo stato del tuo lavoro di traduzione, usa il describe-text-translation-jobcomando.

Esempio escribe-text-translation-job Comando D

L'esempio seguente controlla lo stato del lavoro fornendo l'ID del lavoro. Questo ID è stato fornito da Amazon Translate quando il processo è stato avviato dal start-text-translation-job comando.

$ aws translate describe-text-translation-job \ > --job-id 4446f95f20c88a4b347449d3671fbe3d

Amazon Translate risponde indicando le proprietà del lavoro, che includono lo stato:

{ "TextTranslationJobProperties": { "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobName": "my-translation-job", "JobStatus": "COMPLETED", "JobDetails": { "TranslatedDocumentsCount": 0, "DocumentsWithErrorsCount": 0, "InputDocumentsCount": 1 }, "SourceLanguageCode": "en", "TargetLanguageCodes": [ "es", "it" ], "SubmittedTime": 1598661012.468, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/input/", "ContentType": "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet" }, "OutputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/output/111122223333-TranslateText-4446f95f20c88a4b347449d3671fbe3d/" }, "DataAccessRoleArn": "arn:aws:iam::111122223333:role/my-iam-role" } }

Se il JobStatus valore èIN_PROGRESS, attendi che trascorrano alcuni minuti ed esegui di describe-text-translation-jobnuovo fino a raggiungere lo stato. COMPLETED Una volta completato il lavoro, puoi scaricare i risultati della traduzione nella posizione fornita dal S3Uri campo sottostanteOutputDataConfig.

Per inviare un lavoro di traduzione in batch utilizzando l'API Amazon Translate, utilizza l'StartTextTranslationJoboperazione.