Transcribir una transmisión en tiempo real utilizando un vocabulario médico personalizado - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Transcribir una transmisión en tiempo real utilizando un vocabulario médico personalizado

Para mejorar la precisión de la transcripción en una transmisión en tiempo real, puedes usar un vocabulario personalizado mediante HTTP/2 o WebSocket secuencias. Para iniciar una solicitud HTTP/2, usa la StartMedicalStreamTranscriptionAPI. Puede utilizar un vocabulario personalizado en tiempo real mediante la StartMedicalStreamTranscriptionAPI o el WebSocket protocolo.AWS Management Console

Para usar elAWS Management Console para transcribir el audio en streaming de un dictado médico, elija la opción de transcribir un dictado médico, iniciar la transmisión y empezar a hablar por el micrófono.

Para transcribir el audio en streaming de un dictado médico (AWS Management Console)
  1. Inicie sesión en AWS Management Console.

  2. En el panel de navegación, bajoAmazon Transcribe Médico, elija Transcrición en tiempo real.

  3. En cuanto a la especialidad médica, elija la especialidad médica del médico que hable en la corriente.

  4. Para el tipo de entrada de audio, elija Conversación o Dictado.

  5. Para ajustes adicionales, selecciona Vocabulario personalizado.

    1. Para la selección de vocabulario, elige el vocabulario personalizado.

  6. Elija Start streaming (Comenzar streaming).

  7. Habla por el micrófono.

La siguiente es la sintaxis de los parámetros de una solicitud HTTP/2.

POST /medical-stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com authorization: Generated value x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS x-amz-date: 20220208T235959Z x-amzn-transcribe-session-id: my-first-http2-med-stream x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-vocabulary-name: my-first-med-vocab x-amzn-transcribe-specialty: PRIMARYCARE x-amzn-transcribe-type: CONVERSATION x-amzn-transcribe-show-speaker-label: true Content-type: application/vnd.amazon.eventstream transfer-encoding: chunked

Descripciones de parámetros:

  • host: actualice elRegión de AWS ('us-west-2' en el ejemplo anterior) con elRegión de AWS que está llamando. Para obtener una lista de los puntos deRegiones de AWS conexión válidos, consulte Regiones de AWSy Endpoints.

  • autorización: se trata de un campo generado. Para obtener más información sobre cómo crear una firma, consulte FirmarAWS solicitudes con la versión 4 de Signature.

  • x-amz-target: No modifique este campo; utilice el contenido que se muestra en el ejemplo anterior.

  • x-amz-content-sha256: Se trata de un campo generado. Para obtener más información sobre cómo calcular una firma, consulte FirmarAWS solicitudes con la versión 4 de Signature.

  • x-amz-date: la hora en la que se crea la firma. El formato es YYYYMMDDTHHMMSSZ, donde YYYY=año, MM=mes, dd=día, HH=hora, MM=minuto, SS=segundos y 'T' y 'Z' son caracteres fijos. Para obtener más información, consulte Manejo de fechas en la versión 4 de Signature.

  • x-amzn-transcribe-session-id: el nombre de la sesión de streaming.

  • x-amzn-transcribe-language-code: la codificación utilizada para el audio de entrada. Consulte StartMedicalStreamTranscriptionoIdiomas compatibles y características específicas de cada idioma para obtener una lista de valores válidos.

  • x-amzn-transcribe-media-codificación: la codificación utilizada para el audio de entrada. Los valores válidos son pcm, ogg-opus y flac.

  • x-amzn-transcribe-sample-frecuencia: la frecuencia de muestreo del audio de entrada (en hercios). Amazon Transcribeadmite un rango de 8.000 Hz a 48.000 Hz. El audio de baja calidad, como el audio del teléfono, suele rondar los 8.000 Hz. El audio de alta calidad suele oscilar entre 16 000 Hz y 48 000 Hz. Tenga en cuenta que la frecuencia de muestreo que especifique debe coincidir con la del audio.

  • x-amzn-transcribe-vocabulary-nombre: el nombre del vocabulario que quieres usar en la transcripción.

  • x-amzn-transcribe-specialty: La especialidad médica que se está transcribiendo.

  • x-amzn-transcribe-type: Elige si se trata de un dictado o de una conversación.

  • x-amzn-transcribe-show-speaker-label: para habilitar la diarización, este valor debe sertrue.

  • tipo de contenido: no modifique este campo; utilice el contenido que se muestra en el ejemplo anterior.

Para particionar los altavoces en WebSocket secuencias con la API, utilice el siguiente formato para crear un URI prefirmado para iniciar una WebSocket solicitud yvocabulary-name definirlo con el nombre del vocabulario personalizado.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket ?language-code=en-US &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=Signature Version 4 signature &X-Amz-SignedHeaders=host &media-encoding=flac &sample-rate=16000 &session-id=sessionId &specialty=medicalSpecialty &type=CONVERSATION &vocabulary-name=vocabularyName &show-speaker-label=boolean