Executando um trabalho de tradução em lote - Amazon Translate

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Executando um trabalho de tradução em lote

Você pode executar um trabalho de tradução em lote usando o console do Amazon TranslateAWS CLI, o ou a API do Amazon Translate.

nota

Os trabalhos de tradução em lote são operações de longa duração e podem levar um tempo significativo para serem concluídos. Por exemplo, a tradução em lote em um conjunto de dados pequeno pode levar alguns minutos, enquanto conjuntos de dados muito grandes podem levar até 2 dias ou mais para serem traduzidos. O tempo de conclusão também depende da disponibilidade de recursos.

Para executar um trabalho de tradução usando o console do Amazon Translate, use a página de Tradução em lote para criar o trabalho:

  1. Abra o console do Amazon Translate.

  2. No menu de navegação à esquerda, escolha Batch translation (Tradução em lote).

  3. Na página Trabalhos de tradução, escolha Criar trabalho. O console mostra a página Criar trabalho de tradução.

  4. Em Configurações do trabalho, faça o seguinte:

    1. Em Nome, insira um nome personalizado para o trabalho de tradução em lote.

    2. Em Idioma de origem, selecione o idioma dos arquivos de origem. Se você não souber o idioma dos arquivos de origem ou se seus documentos de entrada contiverem idiomas de origem diferentes, selecione auto. O Amazon Translate detecta automaticamente o idioma de origem de cada arquivo.

    3. Em Idiomas de destino, selecione até 10 idiomas. O Amazon Translate traduz cada arquivo de origem para cada idioma de destino.

  5. Em Dados de entrada, faça o seguinte:

    1. Para a Localização do Input S3, especifique a pasta de entrada que contém os arquivos de origem da tradução no Amazon S3. Para fornecer a pasta navegando até ela no Amazon S3, escolha Selecionar pasta.

    2. Em Formato do arquivo, selecione o formato dos arquivos de origem da tradução.

  6. Em Dados de saída, faça o seguinte:

    1. Para a localização do Output S3, especifique a pasta de saída no Amazon S3 onde o Amazon Translate coloca a saída da tradução. Para fornecer a pasta navegando até ela no Amazon S3, escolha Selecionar pasta.

    2. Opcionalmente, escolha Customize encryption settings (advanced) (Personalizar configurações de criptografia (avançadas)) se quiser criptografar sua saída com uma chave gerenciada pelo cliente que você gerencia no AWS Key Management Service (AWS KMS).

      Por padrão, o Amazon Translate criptografa sua saída de tradução usando uma chave do KMS que é criada, gerenciada e usada em seu nome pelo AWS. Escolha essa opção se quiser criptografar sua saída com sua própria chave do KMS.

      Se desejar usar uma chave do KMS da conta da AWS atual, selecione-a em Escolha uma chave AWS Key Management Service. Ou, se quiser usar uma chave do KMS de outra conta da AWS, insira o Amazon Resource Name (ARN) dessa chave.

      nota

      Antes de usar sua própria chave do KMS, você deve adicionar permissões o perfil de serviço do Amazon Translate no IAM. Se quiser usar uma chave do KMS de outra conta, você também deverá atualizar a política de chaves em AWS KMS. Para obter mais informações, consulte Permissões de pré-requisito para personalizar a criptografia.

  7. Em Customizations - optional (Personalizações - opcional), você pode escolher personalizar a saída do seu trabalho de tradução com as seguintes configurações:

    Profanity (Palavrões)

    Mascara palavras e frases profanas em sua saída de tradução. Se você especificar vários idiomas de destino para o trabalho, todos os idiomas de destino devem suportar o mascaramento de palavrões. Se algum dos idiomas de destino não suportar o mascaramento de palavrões, o trabalho de tradução não mascarará o uso de palavrões em nenhum idioma de destino.

    Para obter mais informações, consulte Mascarando palavras e frases profanas no Amazon Translate.

    Brevidade

    O Amazon Translate não oferece suporte à brevidade para trabalhos de tradução em lote.

    Para obter mais informações, consulte Usando brevidade no Amazon Translate.

    Formality (Formalidade)

    Para alguns idiomas de destino, você pode definir Formality (Formalidade) como formal ou informal. Se você especificar vários idiomas de destino para o trabalho, o translate ignorará a configuração de formalidade para qualquer idioma de destino não suportado.

    Para obter mais informações, consulte Definindo a formalidade no Amazon Translate.

    Terminologia personalizada

    Consiste em exemplos de termos de origem e na tradução desejada para cada termo. Se você especificar vários idiomas de destino para o trabalho, o translate usará a terminologia designada para cada idioma de destino solicitado que tenha uma entrada para o termo de origem no arquivo de terminologia.

    Para obter mais informações, consulte Personalizando suas traduções com terminologia personalizada.

    Dados paralelos

    Consiste de exemplos que mostram como você deseja que segmentos de texto sejam traduzidos. Se você especificar vários idiomas de destino para o trabalho, o arquivo de dados paralelo deverá incluir traduções para todos os idiomas de destino.

    Ao adicionar dados paralelos a um trabalho de tradução em lote, você cria um trabalho de Tradução personalizada ativa.

    nota

    Os trabalhos de tradução personalizada ativa têm um preço mais alto do que outros trabalhos que não usam dados paralelos. Para obter mais informações, consulte Preços do Amazon Translate.

    Para obter mais informações, consulte Personalizando suas traduções com dados paralelos (Tradução personalizada ativa).

  8. Em Permissões de acesso, forneça ao Amazon Translate um perfil do IAM que conceda as permissões necessárias para seus arquivos de entrada e saída no Amazon S3:

    • Se você já tem esse perfil do IAM em sua conta, escolha Usar um perfil do IAM existente e selecione-o em Perfil do IAM.

    • Se você ainda não tem esse perfil do IAM em sua conta, escolha Create an IAM role (Criar um perfil do IAM). Em IAM role (Perfil do IAM), escolha Input and output S3 buckets (buckets S3 de entrada e saída). Em Role name (Nome do perfil), forneça um nome. Ao criar o trabalho de tradução, o Amazon Translate cria o perfil automaticamente. O nome da função no IAM é prefixado com AmazonTranslateServiceRole-.

      nota

      Se você optar por criptografar sua saída de tradução com sua própria chave do KMS, não poderá escolher Create an IAM role (Criar um perfil do IAM). Nesse caso, você deve usar um perfil preexistente do IAM, e sua chave do KMS deve ter uma política de chaves que permita que o perfil use a chave.

      Para obter mais informações, consulte Permissões de pré-requisito para personalizar a criptografia.

  9. Escolha Criar trabalho.

    O console retorna à página Translation jobs (Trabalhos de tradução), onde o status da criação do trabalho é mostrado em um banner na parte superior da página. Após alguns minutos, seu trabalho é exibido na tabela.

  10. Escolha o nome do trabalho na coluna Nome para abrir a página de detalhes do trabalho.

    Enquanto seu trabalho de tradução é executado, o campo Status mostra In progress (Em andamento).

  11. Quando o status for Concluído, acesse o resultado da tradução escolhendo o link em Output file location (Local do arquivo de saída). O console vai até o seu bucket de saída no Amazon S3.

  12. Para baixar seus arquivos de saída, marque a caixa de seleção de cada um e escolha Download.

Para executar um trabalho de tradução usando o AWS CLI, use o comando start-text-translation-job e especifique o nome do seu recurso de dados paralelo para o parâmetro parallel-data-names.

exemplo tart-text-translation-job Comando S

O exemplo a seguir executa um trabalho de tradução enviando um arquivo do Excel que é armazenado em um bucket de entrada no Amazon S3. Esse trabalho é personalizado pelos dados paralelos incluídos na solicitação.

$ aws translate start-text-translation-job \ > --input-data-config ContentType=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet,S3Uri=s3://my-s3-bucket/input/ \ > --output-data-config S3Uri=s3://my-s3-bucket/output/ \ > --data-access-role-arn arn:aws:iam::111122223333:role/my-iam-role \ > --source-language-code en \ > --target-language-codes es it \ > --job-name my-translation-job

Se o comando for bem-sucedido, o Amazon Translate responderá com o ID e status de trabalho:

{ "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobStatus": "SUBMITTED" }

Se quiser personalizar a saída do seu trabalho de tradução, é possível usar os seguintes parâmetros:

--settings

Configurações para configurar sua saída de tradução, incluindo as seguintes opções:

Ative a brevidade na saída da tradução. O Amazon Translate não oferece suporte à brevidade para trabalhos de tradução em lote. Para obter mais informações, consulte Usando brevidade no Amazon Translate.

Habilite palavrões para mascarar palavras e frases profanas. Para habilitar, defina o parâmetro de palavrões para Profanity=MASK. Para obter mais informações, consulte Mascarando palavras e frases profanas no Amazon Translate. Se algum dos idiomas de destino não suportar o mascaramento de palavrões, o trabalho de tradução não mascarará o uso de palavrões em nenhum idioma de destino.

Defina o nível de formalidade na saída da tradução. Defina o parâmetro Formality como FORMAL ouINFORMAL. Se você especificar vários idiomas de destino para o trabalho, o translate ignorará a configuração de formalidade para qualquer idioma de destino não suportado. Para obter mais informações, consulte Definindo a formalidade no Amazon Translate.

--terminology-names

O nome de um recurso de terminologia personalizada a ser adicionado ao trabalho de tradução. Este recurso lista exemplos de termos de origem e a tradução desejada para cada termo. Se você especificar vários idiomas de destino para o trabalho, o translate usará a terminologia designada para cada idioma de destino solicitado que tenha uma entrada para o termo de origem no arquivo de terminologia.

Esse parâmetro aceita somente um recurso de terminologia personalizada.

Para obter uma lista dos recursos de terminologia personalizada disponíveis, use o comando list-terminologies.

Para obter mais informações, consulte Personalizando suas traduções com terminologia personalizada.

--parallel-data-names

O nome de um recurso de dados paralelo a ser adicionado ao trabalho de tradução. Esse recurso consiste em exemplos que mostram como você deseja que segmentos de texto sejam traduzidos. Se você especificar vários idiomas de destino para o trabalho, o arquivo de dados paralelo deverá incluir traduções para todos os idiomas de destino.

Ao adicionar dados paralelos a um trabalho de tradução, você cria um trabalho de Active Custom Translation (Tradução personalizada ativa).

Esse parâmetro aceita somente um recurso de dados paralelos.

nota

Os trabalhos de tradução personalizada ativa têm um preço mais alto do que outros trabalhos que não usam dados paralelos. Para obter mais informações, consulte Preços do Amazon Translate.

Para obter uma lista dos recursos de dados paralelos disponíveis, use o comando list-parallel-data.

Para obter mais informações, consulte Personalizando suas traduções com dados paralelos (Tradução personalizada ativa).

Para verificar o status do seu trabalho de tradução, use o comando describe-text-translation-job.

exemplo escribe-text-translation-job Comando D

O exemplo a seguir verifica o status do trabalho fornecendo o ID do trabalho. Essa ID foi fornecida pelo Amazon Translate quando o trabalho foi iniciado pelo comando start-text-translation-job.

$ aws translate describe-text-translation-job \ > --job-id 4446f95f20c88a4b347449d3671fbe3d

O Amazon Translate responde com as propriedades do trabalho, que incluem seu status:

{ "TextTranslationJobProperties": { "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobName": "my-translation-job", "JobStatus": "COMPLETED", "JobDetails": { "TranslatedDocumentsCount": 0, "DocumentsWithErrorsCount": 0, "InputDocumentsCount": 1 }, "SourceLanguageCode": "en", "TargetLanguageCodes": [ "es", "it" ], "SubmittedTime": 1598661012.468, "InputDataConfig": { "S3Uri": "s3://my-s3-bucket/input/", "ContentType": "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet" }, "OutputDataConfig": { "S3Uri": "s3://my-s3-bucket/output/111122223333-TranslateText-4446f95f20c88a4b347449d3671fbe3d/" }, "DataAccessRoleArn": "arn:aws:iam::111122223333:role/my-iam-role" } }

Se o valor JobStatus for IN_PROGRESS, aguarde alguns minutos e execute describe-text-translation-job novamente até que o status seja COMPLETED. Quando o trabalho for concluído, você poderá baixar os resultados da tradução no local fornecido pelo campo S3Uri abaixoOutputDataConfig.

Para enviar um trabalho de tradução em lote usando a API Amazon Translate, use a StartTextTranslationJoboperação.