Usar um arquivo de texto para criar um vocabulário médico personalizado

Para criar um vocabulário personalizado, você deve ter preparado um arquivo de texto que contenha uma coleção de palavras ou frases. Amazon Transcribe O Medical usa esse arquivo de texto para criar um vocabulário personalizado que você pode usar para melhorar a precisão da transcrição dessas palavras ou frases. Você pode criar um vocabulário personalizado usando a CreateMedicalVocabularyAPI ou o console Amazon Transcribe médico.

Para usar o AWS Management Console para criar um vocabulário personalizado, você fornece o Amazon S3 URI do arquivo de texto contendo suas palavras ou frases.

Faça login no AWS Management Console.
No painel de navegação, em Amazon Transcribe Médico, escolha Vocabulário personalizado.
Em Nome, em Configurações de vocabulário, escolha um nome para o vocabulário personalizado.
Especifique a localização do arquivo de áudio ou arquivo de vídeo no Amazon S3:
- Em Local do arquivo de entrada de vocabulário no S3, em Configurações de vocabulário, especifique o URI do Amazon S3 que identifica o arquivo de texto que você usará para criar o vocabulário personalizado.
- Em Local do arquivo de entrada de vocabulário no S3, escolha Procurar no S3 para procurar o arquivo de texto e escolhê-lo.
Selecione Criar vocabulário.

Você pode ver o status de processamento do vocabulário personalizado no AWS Management Console.

Como criar um vocabulário médico personalizado (API)

Para a API StartTranscriptionJob, especifique o seguinte.
1. Em LanguageCode, especifique en-US.
2. ParaVocabularyFileUri, especifique a Amazon S3 localização do arquivo de texto que você usa para definir seu vocabulário personalizado.
3. Em VocabularyName, especifique um nome para o vocabulário personalizado. O nome que você especificar deve ser exclusivo em seu Conta da AWS.

Para ver o status de processamento do vocabulário personalizado, use a API GetMedicalVocabulary.

Veja a seguir um exemplo de solicitação usando o AWS SDK para Python (Boto3) para criar um vocabulário personalizado.



from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Como habilitar a separação de oradores (locutores) em um trabalho de transcrição em lote (AWS CLI)

Execute o código a seguir.



aws transcribe create-medical-vocabulary \
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Criar um arquivo de texto para um vocabulário médico personalizado

Transcrever um arquivo de áudio usando um vocabulário médico personalizado