本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用医学自定义词汇转录实时直播
为了提高实时流中的转录准确性,您可以使用 HTTP/2 或 stre WebSocket ams 使用自定义词汇。要启动 HTTP/2 请求,请使用 StartMedicalStreamTranscription
API。您可以使用AWS Management Console、StartMedicalStreamTranscription
API 或使用 WebSocket 协议实时使用自定义词汇表。
要使用转录医学听写的流媒体音频,请选择转录医学听写的选项,开始直播,然后开始对着麦克风说话。AWS Management Console
转录医学听写的流媒体音频 (AWS Management Console)
-
在导航窗格中的 MAmazon Transcribe edical 项下,选择实时转录。
-
对于医学专业,请选择在直播中发言的临床医生的医学专业。
-
对于音频输入类型,选择 “对话” 或 “听写”。
-
对于其他设置,请选择自定义词汇。
-
要选择词汇,请选择自定义词汇。
-
-
选择 Start streaming(开始流式传输)。
-
对着麦克风说话。
以下是 HTTP/2 请求参数的语法。
POST /medical-stream-transcription HTTP/2 host: transcribestreaming.
us-west-2
.amazonaws.com authorization:Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription x-amz-content-sha256:STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date:20220208T235959Z
x-amzn-transcribe-session-id:my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding:flac
x-amzn-transcribe-sample-rate:16000
x-amzn-transcribe-vocabulary-name:my-first-med-vocab
x-amzn-transcribe-specialty:PRIMARYCARE
x-amzn-transcribe-type:CONVERSATION
x-amzn-transcribe-show-speaker-label: true Content-type: application/vnd.amazon.eventstream transfer-encoding: chunked
参数描述:
-
主机:使用AWS 区域您正在调用的AWS 区域(前面的示例中的 “us-west-2”)进行更新。有关有效列表AWS 区域,请参阅AWS 区域和终端节点。
-
授权:这是一个生成的字段。要了解有关创建签名的更多信息,请参阅使用签名版本 4 签署AWS请求。
-
x-amz-target: 请勿更改此字段;请使用前面示例中显示的内容。
-
x-amz-content-sha256:这是生成的字段。要了解有关计算签名的更多信息,请参阅使用签名版本 4 签署AWS请求。
-
x-amz-date:创建签名的日期和时间。格式为 YYYYMDDTHHMSSZ,其中 yyyy=YEAR、mm=month、dd=day、HH=Hour、mm=minute、ss=seconds 以及 'T' 和 'Z' 是固定字符。有关更多信息,请参阅签名版本 4 中的处理日期。
-
x-amzn-transcribe-session-id:您的流媒体会话的名称。
-
x-amzn-transcribe-language-code:用于输入音频的编码。有关有效值支持的语言和特定语言的特征的列表,请参阅
StartMedicalStreamTranscription
或。 -
x-amzn-transcribe-media-enco ding:用于输入音频的编码。有效值包括
pcm
、ogg-opus
和flac
。 -
x-amzn-transcribe-sample-r ate:输入音频的采样率(以赫兹为单位)。 Amazon Transcribe支持从 8,000 Hz 到 48,000 Hz 的范围。低质量音频,例如电话音频,通常在 8,000 Hz 左右。高质量音频的范围通常介于 16,000 Hz 到 48,000 Hz 之间。请注意,您指定的采样率必须与音频的采样率相匹配。
-
x-amzn-transcribe-vocabulary-nam e:您想在转录中使用的词汇的名称。
-
x-amzn-transcribe-specialty: 医学专业正在转录。
-
x-amzn-transcribe-type:选择这是听写还是对话。
-
x-amzn-transcribe-show-speaker-label:要启用降序功能,此值必须为
true
。 -
c@@ ontent-type:请勿更改此字段;请使用前面示例中显示的内容。
要使用 API 对 WebSocket 直播中的发言者进行分区,请使用以下格式创建预签名 URI 以启动 WebSocket 请求并设置为vocabulary-name
自定义词汇表的名称。
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/medical-stream-transcription-websocket ?language-code=en-US &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature
&X-Amz-SignedHeaders=host &media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean