Transcribir una transmisión en tiempo real utilizando un vocabulario médico personalizado

Para mejorar la precisión de la transcripción en una transmisión en tiempo real, puedes usar un vocabulario personalizado utilizando HTTP/2 o WebSocket secuencias. Para iniciar una solicitud HTTP/2, utilice la API de StartMedicalStreamTranscription. Puedes usar un vocabulario personalizado en tiempo real mediante la StartMedicalStreamTranscriptionAPI o mediante el WebSocket protocolo. AWS Management Console

Para usar la AWS Management Console transcripción del audio en streaming de un dictado médico, elige la opción de transcribir un dictado médico, inicia la transmisión y comienza a hablar por el micrófono.

Para transcribir el audio en streaming de un dictado médico (AWS Management Console)

Inicie sesión en la AWS Management Console.
En el panel de navegación, en Amazon Transcribe Medicina, selecciona Transcripción en tiempo real.
Para Especialidad médica, elija la especialidad médica del médico que habla en la transmisión.
En Tipo de entrada de audio, seleccione Conversación o Dictado.
En ajustes adicionales, seleccione Vocabulario personalizado.
1. En Selección de vocabulario, elija el vocabulario personalizado.
Elija Comenzar streaming.
Hable al micrófono.

La siguiente es la sintaxis de los parámetros de una solicitud HTTP/2.


POST /medical-stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
authorization: Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription
x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date: 20220208T235959Z
x-amzn-transcribe-session-id: my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000
x-amzn-transcribe-vocabulary-name: my-first-med-vocab
x-amzn-transcribe-specialty: PRIMARYCARE
x-amzn-transcribe-type: CONVERSATION
x-amzn-transcribe-show-speaker-label: true
Content-type: application/vnd.amazon.eventstream
transfer-encoding: chunked

Descripciones de los parámetros:

host: actualiza el Región de AWS ('us-west-2' en el ejemplo anterior) con Región de AWS el que estás llamando. Para obtener una lista de puntos finales válidos Regiones de AWS, consulte Regiones de AWS y Endpoints.
autorización: se trata de un campo generado. Para obtener más información sobre cómo crear una firma, consulte Firmar AWS solicitudes con la versión 4 de Signature.
x-amz-target: No modifique este campo; utilice el contenido que se muestra en el ejemplo anterior.
x-amz-content-sha256: Se trata de un campo generado. Para obtener más información sobre el cálculo de una firma, consulte Firmar AWS solicitudes con firma, versión 4.
x-amz-date: la fecha y la hora en que se creó la firma. El formato es YYYMMDDTHHMMSSZ, donde YYYY=año, MM=mes, DD=día, HH=hora, MM=minuto, SS=segundos y 'T' y 'Z' son caracteres fijos. Para obtener más información, consulte Control de fechas en Signature Version 4.
x-amzn-transcribe-session-id: el nombre de tu sesión de streaming.
x-amzn-transcribe-language-code: la codificación utilizada para el audio de entrada. Consulte StartMedicalStreamTranscription o Idiomas compatibles y características específicas de cada idioma para obtener una lista de valores válidos.
x-amzn-transcribe-media-codificación: la codificación utilizada para el audio de entrada. Los valores válidos son pcm, ogg-opus y flac.
x-amzn-transcribe-sample-frecuencia: frecuencia de muestreo del audio de entrada (en hercios). Amazon Transcribe admite un rango de 8.000 Hz a 48.000 Hz. El audio de baja calidad, como el audio de un teléfono, suele rondar los 8 000 Hz. El audio de alta calidad suele oscilar entre 16 000 Hz y 48 000 Hz. Tenga en cuenta que la frecuencia de muestreo que especifique debe coincidir con la del audio.
x-amzn-transcribe-vocabulary-name: el nombre del vocabulario que quieres usar con tu transcripción.
x-amzn-transcribe-specialty: La especialidad médica que se está transcribiendo.
x-amzn-transcribe-type: Elige si se trata de un dictado o de una conversación.
x-amzn-transcribe-show-speaker-label: para habilitar la diarización, este valor debe ser. true
x-amz-target: no modifique este campo; utilice el contenido que se muestra en el ejemplo anterior.

Para particionar los altavoces en las WebSocket transmisiones con la API, usa el siguiente formato para crear un URI prefirmado para iniciar una WebSocket solicitud y vocabulary-name establecer el nombre del vocabulario personalizado.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=en-US
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Transcribir un archivo de audio utilizando un vocabulario médico personalizado

Juego de caracteres para medicina Amazon Transcribe