Criação de um vocabulário personalizado usando uma lista - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criação de um vocabulário personalizado usando uma lista

Você pode criar vocabulários personalizados a partir de listas usando os AWS SDKs AWS Management ConsoleAWS CLI, ou.

  • AWS Management Console: Você deve criar e carregar um arquivo de texto contendo seu vocabulário personalizado. Você pode usar entradas separadas por linha ou por vírgula. Observe que sua lista deve ser salva como um arquivo de texto (*.txt) no formato. LF Se você usar qualquer outro formato, comoCRLF, seu vocabulário personalizado não será aceito peloAmazon Transcribe.

  • AWS CLIe AWSSDKs: você deve incluir seu vocabulário personalizado como entradas separadas por vírgula em sua chamada de API usando a sinalização. Phrases

Se uma entrada contiver várias palavras, você deverá hifenizar cada palavra. Por exemplo, você inclui “Los Angeles” como Los-Angeles e “Andorra la Vella” como. Andorra-la-Vella

Aqui estão alguns exemplos dos dois formatos de lista válidos. Consulte Criar listas de vocabulário personalizadas para obter exemplos específicos de métodos.

  • Entradas separadas por vírgula:

    Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
  • Entradas separadas por linha:

    Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
Importante

Você só pode usar caracteres compatíveis com o seu idioma. Consulte o conjunto de caracteres do seu idioma para obter detalhes.

As listas de vocabulário personalizadas não são suportadas com a CreateMedicalVocabularyoperação. Ao criar um vocabulário médico personalizado, você deve usar um formato de tabela; consulte Criar um vocabulário personalizado usando uma tabela para obter instruções.

Criar listas de vocabulário personalizadas

Para processar uma lista de vocabulário personalizada para uso comAmazon Transcribe, veja os exemplos a seguir:

Este exemplo usa o comando create-vocabulary com um arquivo de vocabulário personalizado formatado em lista. Para obter mais informações, consulte CreateVocabulary.

aws transcribe create-vocabulary \ --vocabulary-name my-first-vocabulary \ --language-code en-US \ --phrases {CLI,Eva-Maria,ABCs}

Aqui está outro exemplo usando o comando create-vocabulary e um corpo de solicitação que cria seu vocabulário personalizado.

aws transcribe create-vocabulary \ --cli-input-json file://filepath/my-first-vocab-list.json

O arquivo my-first-vocab-list.json contém o corpo da solicitação a seguir.

{ "VocabularyName": "my-first-vocabulary", "LanguageCode": "en-US", "Phrases": [ "CLI","Eva-Maria","ABCs" ] }

Depois de VocabularyState mudar de PENDING paraREADY, seu vocabulário personalizado estará pronto para ser usado com uma transcrição. Para visualizar o status atual do seu vocabulário personalizado, execute:

aws transcribe get-vocabulary \ --vocabulary-name my-first-vocabulary

Este exemplo usa o AWS SDK for Python (Boto3) para criar um vocabulário personalizado a partir de uma lista usando o método create_vocabulary. Para obter mais informações, consulte CreateVocabulary.

Para ver exemplos adicionais de uso dos AWS SDKs, incluindo exemplos específicos de recursos, cenários e entre serviços, consulte o capítulo. Exemplos de código para o Amazon Transcribe usando AWS SDKs

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_vocabulary( LanguageCode = 'en-US', VocabularyName = vocab_name, Phrases = [ 'CLI','Eva-Maria','ABCs' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
nota

Se você criar um novo Amazon S3 bucket para seus arquivos de vocabulário personalizados, certifique-se de que a IAM função que está fazendo a CreateVocabularysolicitação tenha permissões para acessar esse bucket. Se a função não tiver as permissões corretas, sua solicitação falhará. Opcionalmente, você pode especificar uma IAM função em sua solicitação incluindo o DataAccessRoleArn parâmetro. Para obter mais informações sobre IAM funções e políticas emAmazon Transcribe, consulteExemplos de políticas baseadas em identidade do Amazon Transcribe.