Transcription d'un flux en temps réel à l'aide d'un vocabulaire médical personnalisé - Amazon Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Transcription d'un flux en temps réel à l'aide d'un vocabulaire médical personnalisé

Pour améliorer la précision de la transcription dans un flux en temps réel, vous pouvez utiliser un vocabulaire personnalisé utilisant HTTP/2 ou WebSocket des flux. Pour démarrer une requête HTTP/2, utilisez l'StartMedicalStreamTranscriptionAPI. Vous pouvez utiliser un vocabulaire personnalisé en temps réel àAWS Management Console l'aide de l'StartMedicalStreamTranscriptionAPI ou du WebSocket protocole.

AWS Management ConsolePour transcrire le son en streaming d'une dictée médicale, choisissez l'option permettant de transcrire une dictée médicale, lancez la diffusion et commencez à parler dans le microphone.

Pour transcrire le son en streaming d'une dictée médicale (AWS Management Console)
  1. Connectez-vous à AWS Management Console.

  2. Dans le panneau de navigation, sousAmazon Transcribe Médical, sélectionnez Transcription en temps réel de transcription.

  3. Pour Spécialité médicale, choisissez la spécialité médicale du clinicien qui parle dans le stream.

  4. Pour le type d'entrée audio, choisissez Conversation ou Dictée.

  5. Pour Paramètres supplémentaires, choisissez Vocabulaire personnalisé.

    1. Pour la sélection du vocabulaire, choisissez le vocabulaire personnalisé.

  6. Choisissez Start streaming (Démarrer la diffusion).

  7. Parlez dans le micro.

Voici la syntaxe des paramètres d'une requête HTTP/2.

POST /medical-stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com authorization: Generated value x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS x-amz-date: 20220208T235959Z x-amzn-transcribe-session-id: my-first-http2-med-stream x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-vocabulary-name: my-first-med-vocab x-amzn-transcribe-specialty: PRIMARYCARE x-amzn-transcribe-type: CONVERSATION x-amzn-transcribe-show-speaker-label: true Content-type: application/vnd.amazon.eventstream transfer-encoding: chunked

Descriptions des paramètres :

  • host : mettez à jour leRégion AWS ('us-west-2' dans l'exemple précédent) avec celuiRégion AWS que vous appelez. Pour obtenir la liste des points de terminaison validesRégions AWS, voir Régions AWSet Endpoints.

  • autorisation : Ce champ est généré. Pour en savoir plus sur la création d'une signature, consultez la section Signature deAWS demandes avec Signature version 4.

  • x-amz-target: ne modifiez pas ce champ ; utilisez le contenu présenté dans l'exemple précédent.

  • x-amz-content-sha256 : Il s'agit d'un champ généré. Pour en savoir plus sur le calcul d'une signature, voir Signature de AWSdemandes avec Signature version 4.

  • x-amz-date: date et heure de création de signature. Le format est YYYYMMDDTHHMMSSZ, où YYY=année, MM=mois, DD=jour, HH=heure, MM=minute, SS=secondes, et « T » et « Z » sont des caractères fixes. Pour plus d'informations, consultez la page Gestion des dates dans Signature Version 4 de caractères caractères, sous forme de caractères, de caractères

  • x-amzn-transcribe-session-id : nom de votre session de streaming.

  • x-amzn-transcribe-language-code : L'encodage utilisé pour votre entrée audio. Reportez-vous à StartMedicalStreamTranscriptionouLangues prises en charge et fonctionnalités spécifiques aux langues pour obtenir une liste de valeurs valides.

  • x-amzn-transcribe-media-encoding : L'encodage utilisé pour votre entrée audio. Les valeurs valides sont pcm, ogg-opus et flac.

  • x-amzn-transcribe-sample-rate : fréquence d'échantillonnage du signal audio d'entrée (en Hertz). Amazon Transcribeprend en charge une plage de 8 000 Hz à 48 000 Hz. Un son de faible qualité, tel que le son d'un téléphone, est généralement d'environ 8 000 Hz. Un son de haute qualité varie généralement entre 16 000 Hz et 48 000 Hz. Notez que la fréquence d'échantillonnage que vous spécifiez doit correspondre à celle de votre audio.

  • x-amzn-transcribe-vocabulary-name : Le nom du vocabulaire que vous souhaitez utiliser avec votre transcription.

  • x-amzn-transcribe-specialty: La spécialité médicale à transcrire.

  • x-amzn-transcribe-type: choisissez s'il s'agit d'une dictée ou d'une conversation.

  • x-amzn-transcribe-show-speaker-label : pour activer la diarisation, cette valeur doit êtretrue.

  • type de contenu : ne modifiez pas ce champ ; utilisez le contenu présenté dans l'exemple précédent.

Pour partitionner les haut-parleurs en WebSocket flux à l'aide de l'API, utilisez le format suivant pour créer un URI pré-signé afin de lancer une WebSocket requête et de définirvocabulary-name le nom du vocabulaire personnalisé.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket ?language-code=en-US &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=Signature Version 4 signature &X-Amz-SignedHeaders=host &media-encoding=flac &sample-rate=16000 &session-id=sessionId &specialty=medicalSpecialty &type=CONVERSATION &vocabulary-name=vocabularyName &show-speaker-label=boolean