Transcription d’un flux en temps réel à l’aide d’un vocabulaire personnalisé médical

Pour améliorer la précision de la transcription dans un flux en temps réel, vous pouvez utiliser un vocabulaire personnalisé en utilisant HTTP/2 ou WebSocket des flux. Pour démarrer une requête HTTP/2, utilisez l’API StartMedicalStreamTranscription. Vous pouvez utiliser un vocabulaire personnalisé en temps réel à AWS Management Console l'aide de l'StartMedicalStreamTranscriptionAPI ou du WebSocket protocole.

AWS Management Console Pour transcrire le son en streaming d'une dictée médicale, choisissez l'option permettant de transcrire une dictée médicale, de démarrer le flux et de commencer à parler dans le microphone.

Pour transcrire l’audio en streaming d’une dictée médicale (AWS Management Console)

Connectez-vous à la AWS Management Console.
Dans le volet de navigation, sous Amazon Transcribe Médical, sélectionnez Transcription en temps réel.
Pour Spécialité médicale, choisissez la spécialité médicale du médecin qui parle dans le flux.
Pour Type d’entrée audio, choisissez Conversation ou Dictée.
Pour Paramètres supplémentaires, choisissez Vocabulaire personnalisé.
1. Pour Sélection du vocabulaire, choisissez le vocabulaire personnalisé.
Choisissez Démarrer le streaming.
Parlez dans le microphone.

Voici la syntaxe des paramètres d’une requête HTTP/2.


POST /medical-stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
authorization: Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription
x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date: 20220208T235959Z
x-amzn-transcribe-session-id: my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000
x-amzn-transcribe-vocabulary-name: my-first-med-vocab
x-amzn-transcribe-specialty: PRIMARYCARE
x-amzn-transcribe-type: CONVERSATION
x-amzn-transcribe-show-speaker-label: true
Content-type: application/vnd.amazon.eventstream
transfer-encoding: chunked

Descriptions des paramètres :

host : Mettez à jour le Région AWS (« us-west-2 » dans l'exemple précédent) avec le nom que vous appelez. Région AWS Pour obtenir la liste des points de terminaison valides Régions AWS, consultez la section Régions AWS et les points de terminaison.
authorization : il s’agit d’un champ généré. Pour en savoir plus sur la création d'une signature, voir Signature des AWS demandes avec Signature Version 4.
x-amz-target: Ne modifiez pas ce champ ; utilisez le contenu indiqué dans l'exemple précédent.
x-amz-content-sha256 : Il s'agit d'un champ généré. Pour en savoir plus sur le calcul d'une signature, voir Signature des AWS demandes avec Signature Version 4.
x-amz-date: date et heure de création de la signature. Le format est YYYYMMDDTHHMMSSZ, où YYYY=année, MM=mois, DD=jour, HH=heure, MM=minute, SS=secondes, et ’T’ et ’Z’ sont des caractères fixes. Pour plus d’informations, consultez la section Gestion des dates dans Signature Version 4.
x-amzn-transcribe-session-id : nom de votre session de streaming.
x-amzn-transcribe-language-code : L'encodage utilisé pour votre entrée audio. Reportez-vous à la section StartMedicalStreamTranscription ou Langues prises en charge et fonctionnalités spécifiques aux langues pour obtenir la liste des valeurs valides.
x-amzn-transcribe-media-encoding : L'encodage utilisé pour votre entrée audio. Les valeurs valides sont pcm, ogg-opus et flac.
x-amzn-transcribe-sample-rate : fréquence d'échantillonnage de l'audio d'entrée (en Hertz). Amazon Transcribe prend en charge une plage de 8 000 Hz à 48 000 Hz. Le son de faible qualité, tel que le son du téléphone, se situe généralement autour de 8 000 Hz. Le son de haute qualité est généralement compris entre 16 000 Hz et 48 000 Hz. Notez que la fréquence d’échantillonnage que vous spécifiez doit correspondre à celle de votre audio.
x-amzn-transcribe-vocabulary-name : nom du vocabulaire que vous souhaitez utiliser pour votre transcription.
x-amzn-transcribe-specialty: La spécialité médicale en cours de transcription.
x-amzn-transcribe-type: Choisissez s'il s'agit d'une dictée ou d'une conversation.
x-amzn-transcribe-show-speaker-label : pour activer la diarisation, cette valeur doit être. true
content-type : ne modifiez pas ce champ ; utilisez le contenu indiqué dans l’exemple précédent.

Pour partitionner les locuteurs en WebSocket flux à l'aide de l'API, utilisez le format suivant pour créer une URI pré-signée afin de lancer une WebSocket demande et de définir vocabulary-name le nom du vocabulaire personnalisé.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=en-US
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Transcription d’un fichier audio à l’aide d’un vocabulaire personnalisé médical

Jeu de caractères pour Amazon Transcribe Medical