Uso de un archivo de texto para crear un vocabulario médico personalizado - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de un archivo de texto para crear un vocabulario médico personalizado

Para crear un vocabulario personalizado, debe haber preparado un archivo de texto que contenga una colección de palabras o frases. Amazon Transcribe Medical utiliza este archivo de texto para crear un vocabulario personalizado que puede utilizar para mejorar la precisión de transcripción de esas palabras o frases. Puede crear un vocabulario personalizado mediante la CreateMedicalVocabularyAPI o la consolaAmazon Transcribe médica.

Para usar elAWS Management Console para crear un vocabulario personalizado, debe proporcionar elAmazon S3 URI del archivo de texto que contiene sus palabras o frases.

  1. Inicie sesión en AWS Management Console.

  2. En el panel de navegación, bajoAmazon Transcribe Médico, elija Vocabulario personalizado.

  3. En Nombre, en Configuración de vocabulario, elige un nombre para tu vocabulario personalizado.

  4. Especifique la ubicación del archivo de audio o de vídeo en Amazon S3:

    • Para ver la ubicación del archivo de entrada de vocabulario en S3, en Configuración de vocabulario, especifique elAmazon S3 URI que identifica el archivo de texto que utilizará para crear su vocabulario personalizado.

    • Para la ubicación del archivo de entrada de vocabulario en S3, elija Examinar S3 para buscar el archivo de texto y seleccionarlo.

  5. Elige Crear vocabulario.

Puede ver el estado de procesamiento de su vocabulario personalizado enAWS Management Console.

Para crear un vocabulario médico personalizado (API)
  • Para la StartTranscriptionJobAPI, especifique lo siguiente.

    1. En LanguageCode, especifique en-US.

    2. ParaVocabularyFileUri, especifique laAmazon S3 ubicación del archivo de texto que utiliza para definir su vocabulario personalizado.

    3. ParaVocabularyName, especifique un nombre para su vocabulario personalizado. El nombre que especifique debe ser único en suCuenta de AWS.

Para ver el estado de procesamiento de tu vocabulario personalizado, usa la GetMedicalVocabularyAPI.

A continuación se muestra un ejemplo de solicitud que utilizaAWS SDK for Python (Boto3) para crear un vocabulario personalizado.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_medical_vocabulary( VocabularyName = job_name, VocabularyFileUri = 's3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-table.txt' LanguageCode = 'en-US', ) while True: status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Para habilitar la partición de altavoces en un trabajo de transcripción por lotes (AWS CLI)
  • Ejecute el siguiente código.

    aws transcribe create-medical-vocabulary \ --vocabulary-name my-first-vocabulary \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-file.txt \ --language-code en-US