Usar un archivo de texto para crear un vocabulario médico personalizado

Para crear un vocabulario personalizado, debe haber preparado un archivo de texto que contenga una colección de palabras o frases. Amazon Transcribe Medical utiliza este archivo de texto para crear un vocabulario personalizado que puede utilizar para mejorar la precisión de la transcripción de esas palabras o frases. Puede crear un vocabulario personalizado mediante la CreateMedicalVocabularyAPI o la consola Amazon Transcribe médica.

Para usarlo y AWS Management Console crear un vocabulario personalizado, debes proporcionar el Amazon S3 URI del archivo de texto que contiene tus palabras o frases.

Inicie sesión en la AWS Management Console.
En el panel de navegación, en Amazon Transcribe Medicina, selecciona Vocabulario personalizado.
En Nombre, en Configuración de vocabulario, elija un nombre para su vocabulario personalizado.
Especifique la ubicación del archivo de audio o de vídeo en Amazon S3:
- En Ubicación del archivo de entrada de vocabulario en S3, en Configuración de vocabulario, especifique el URi de Amazon S3 que identifica el archivo de texto que utilizará para crear su vocabulario personalizado.
- En Ubicación del archivo de entrada de vocabulario en S3, seleccione Examinar S3 para buscar el archivo de texto y seleccionarlo.
Seleccione Crear vocabulario.

Puede ver el estado de procesamiento de su vocabulario personalizado en AWS Management Console.

Para crear un vocabulario médico personalizado (API)

En la API de StartTranscriptionJob, especifique lo siguiente.
1. En LanguageCode, especifique en-US.
2. ParaVocabularyFileUri, especifique la Amazon S3 ubicación del archivo de texto que utiliza para definir su vocabulario personalizado.
3. En VocabularyName, especifique un nombre para su vocabulario personalizado. El nombre que especifique debe ser único dentro de su Cuenta de AWS.

Puede ver el estado de procesamiento de su vocabulario personalizado, utilice la API de GetMedicalVocabulary.

El siguiente es un ejemplo de solicitud AWS SDK para Python (Boto3) que se utiliza para crear un vocabulario personalizado.



from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Para habilitar la partición de las voces en un trabajo de transcripción por lotes (AWS CLI)

Ejecute el siguiente código.



aws transcribe create-medical-vocabulary \
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Crear un archivo de texto para su vocabulario médico personalizado

Transcribir un archivo de audio utilizando un vocabulario médico personalizado