As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Criação de um vocabulário personalizado usando uma lista
Você pode criar vocabulários personalizados a partir de listas usando os AWS SDKs AWS Management ConsoleAWS CLI, ou.
-
AWS Management Console: Você deve criar e carregar um arquivo de texto contendo seu vocabulário personalizado. Você pode usar entradas separadas por linha ou por vírgula. Observe que sua lista deve ser salva como um arquivo de texto (*.txt) no formato.
LF
Se você usar qualquer outro formato, comoCRLF
, seu vocabulário personalizado não será aceito peloAmazon Transcribe. -
AWS CLIe AWSSDKs: você deve incluir seu vocabulário personalizado como entradas separadas por vírgula em sua chamada de API usando a sinalização.
Phrases
Se uma entrada contiver várias palavras, você deverá hifenizar cada palavra. Por exemplo, você inclui “Los Angeles” como Los-Angeles
e “Andorra la Vella” como. Andorra-la-Vella
Aqui estão alguns exemplos dos dois formatos de lista válidos. Consulte Criar listas de vocabulário personalizadas para obter exemplos específicos de métodos.
-
Entradas separadas por vírgula:
Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
-
Entradas separadas por linha:
Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
Importante
Você só pode usar caracteres compatíveis com o seu idioma. Consulte o conjunto de caracteres do seu idioma para obter detalhes.
As listas de vocabulário personalizadas não são suportadas com a CreateMedicalVocabulary
operação. Ao criar um vocabulário médico personalizado, você deve usar um formato de tabela; consulte Criar um vocabulário personalizado usando uma tabela para obter instruções.
Criar listas de vocabulário personalizadas
Para processar uma lista de vocabulário personalizada para uso comAmazon Transcribe, veja os exemplos a seguir:
Este exemplo usa o comando create-vocabulary com um arquivo de vocabulário personalizado formatado em lista. Para obter mais informações, consulte CreateVocabulary
.
aws transcribe create-vocabulary \ --vocabulary-name
my-first-vocabulary
\ --language-codeen-US
\ --phrases {CLI,Eva-Maria,ABCs
}
Aqui está outro exemplo usando o comando create-vocabulary e um corpo de solicitação que cria seu vocabulário personalizado.
aws transcribe create-vocabulary \ --cli-input-json file://
filepath
/my-first-vocab-list
.json
O arquivo my-first-vocab-list.json contém o corpo da solicitação a seguir.
{ "VocabularyName": "
my-first-vocabulary
", "LanguageCode": "en-US
", "Phrases": [ "CLI
","Eva-Maria
","ABCs
" ] }
Depois de VocabularyState
mudar de PENDING
paraREADY
, seu vocabulário personalizado estará pronto para ser usado com uma transcrição. Para visualizar o status atual do seu vocabulário personalizado, execute:
aws transcribe get-vocabulary \ --vocabulary-name
my-first-vocabulary
Este exemplo usa o AWS SDK for Python (Boto3) para criar um vocabulário personalizado a partir de uma lista usando o método create_vocabularyCreateVocabulary
.
Para ver exemplos adicionais de uso dos AWS SDKs, incluindo exemplos específicos de recursos, cenários e entre serviços, consulte o capítulo. Exemplos de código para o Amazon Transcribe usando AWS SDKs
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') vocab_name = "my-first-vocabulary
" response = transcribe.create_vocabulary( LanguageCode = 'en-US
', VocabularyName = vocab_name, Phrases = [ 'CLI
','Eva-Maria
','ABCs
' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
nota
Se você criar um novo Amazon S3 bucket para seus arquivos de vocabulário personalizados, certifique-se de que a IAM função que está fazendo a CreateVocabulary
solicitação tenha permissões para acessar esse bucket. Se a função não tiver as permissões corretas, sua solicitação falhará. Opcionalmente, você pode especificar uma IAM função em sua solicitação incluindo o DataAccessRoleArn
parâmetro. Para obter mais informações sobre IAM funções e políticas emAmazon Transcribe, consulteExemplos de políticas baseadas em identidade do Amazon Transcribe.