StartMedicalStreamTranscription - 轉錄

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

StartMedicalStreamTranscription

啟動雙向 HTTP/2 或 WebSocket 串流,其中音訊會串流至 Amazon Transcribe Medical,而且轉錄結果會串流至您的應用程式。

下列是必要參數:

  • language-code

  • media-encoding

  • sample-rate

如需使用 Amazon 轉錄醫療進行串流的詳細資訊,請參閱轉錄串流音訊。

請求語法

POST /medical-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob } } }

URI 請求參數

請求會使用下列 URI 參數。

ContentIdentificationType

標記您轉錄單中識別的所有個人健康資訊 (PHI)。

內容識別是在區段層級執行;PHI 會在完整轉錄音訊片段時加上旗標。

有關更多信息,請參閱轉錄中的識別個人健康信息(PHI)

有效值: PHI

EnableChannelIdentification

啟用多聲道音訊中的頻道識別。

頻道識別會分別轉錄每個聲道上的音訊,然後將每個頻道的輸出附加到一個文字記錄中。

如果您有多聲道音訊,但未啟用頻道識別功能,您的音訊會以連續的方式進行轉錄,而且您的文字記錄不會被頻道隔開。

如果您包含EnableChannelIdentification在您的請求中,您即必須也包括NumberOfChannels

如需詳細資訊,請參閱轉錄多聲道音訊。

LanguageCode

指定代表音訊中所使用語言的語言代碼。

重要

亞馬遜醫療轉錄僅支持美國英語(en-US)。

有效值: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

必要:是

MediaEncoding

指定用於輸入音訊的編碼。支援的格式包括:

  • 弗拉克

  • Ogg 容器中的 OPUS 編碼音頻

  • PCM(僅簽名 16 位小端音頻格式,不包括 WAV)

如需詳細資訊,請參閱媒體格式

有效值: pcm | ogg-opus | flac

必要:是

MediaSampleRateHertz

輸入音訊的取樣率 (以赫茲為單位)。Amazon Transcribe 醫療支持範圍從 16,000 赫茲到 48,000 赫茲。請注意,您指定的取樣率必須與音訊的取樣率相符。

有效範圍:最小值為 80。最大值為 48。

必要:是

NumberOfChannels

指定音訊串流中頻道的數量。此值必須是2,因為僅支援兩個通道。如果您的音訊不包含多個頻道,請勿在要求中加入此參數。

如果您包含NumberOfChannels在您的請求中,您即必須也包括EnableChannelIdentification

有效範圍:最小值為 2。

SessionId

指定轉錄工作階段的名稱。如果您的請求中沒有包含此參數,Amazon Transcribe 醫療會產生一個 ID 並在回應中傳回 ID。

長度限制:固定長度為 36。

模式:[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

在轉錄輸出中啟用揚聲器分區(日記)。喇叭分割會標示媒體檔案中個別發言者的語音。

如需詳細資訊,請參閱分割喇叭(日記)

Specialty

指定音頻中包含的醫療專業。

有效值: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

必要:是

Type

指定輸入音訊的類型。例如,選擇DICTATION提供者口述患者筆記,並CONVERSATION在患者和醫療專業人員之間進行對話。

有效值: CONVERSATION | DICTATION

必要:是

VocabularyName

指定處理轉錄時要使用的自訂字彙名稱。請注意,字彙名稱會區分大小寫。

長度限制:長度下限為 1。長度上限為 200。

模式:^[0-9a-zA-Z._-]+

請求主體

請求接受採用 JSON 格式的下列資料。

AudioStream

音頻斑點的編碼流。音頻流被編碼為 HTTP/2 或 WebSocket 數據幀。

如需詳細資訊,請參閱轉錄串流音訊串流音訊。

類型:AudioStream 物件

必要:是

回應語法

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "TranscriptResultStream": { "BadRequestException": { }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Entities": [ { "Category": "string", "Confidence": number, "Content": "string", "EndTime": number, "StartTime": number } ], "Items": [ { "Confidence": number, "Content": "string", "EndTime": number, "Speaker": "string", "StartTime": number, "Type": "string" } ], "Transcript": "string" } ], "ChannelId": "string", "EndTime": number, "IsPartial": boolean, "ResultId": "string", "StartTime": number } ] } } } }

回應元素

如果動作成功,則服務傳回 HTTP 200 回應。

回應會傳回下列 HTTP 標頭。

ContentIdentificationType

顯示您的轉錄是否啟用內容識別功能。

有效值: PHI

EnableChannelIdentification

顯示您的轉錄是否啟用頻道識別功能。

LanguageCode

提供您在請求中指定的語言代碼。這必須是 en-US

有效值: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

MediaEncoding

提供您在要求中指定的媒體編碼。

有效值: pcm | ogg-opus | flac

MediaSampleRateHertz

提供您在請求中指定的取樣率。

有效範圍:最小值為 80。最大值為 48。

NumberOfChannels

提供您在請求中指定的通道數量。

有效範圍:最小值為 2。

RequestId

提供串流要求的識別碼。

SessionId

提供轉錄工作階段的識別碼。

長度限制:固定長度為 36。

模式:[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

顯示是否已為您的轉錄啟用喇叭分割。

Specialty

提供您在請求中指定的醫療專業。

有效值: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Type

提供您在請求中指定的音訊類型。

有效值: CONVERSATION | DICTATION

VocabularyName

提供您在請求中指定的自訂字彙的名稱。

長度限制:長度下限為 1。長度上限為 200。

模式:^[0-9a-zA-Z._-]+

服務會傳回下列 JSON 格式的資料。

TranscriptResultStream

提供關於串流工作階段的詳細資訊。

類型:MedicalTranscriptResultStream 物件

錯誤

如需所有動作常見的錯誤相關資訊,請參閱常見錯誤

BadRequestException

StartStreamTranscriptionStartMedicalStreamTranscriptionStartCallAnalyticsStreamTranscription作業的一或多個引數無效。例如,MediaEncodingLanguageCode使用不支持的值。請檢查指定的參數,然後再試一次。

HTTP 狀態碼:400

ConflictException

以相同工作階段 ID 開始的新串流。目前的串流已終止。

HTTP 狀態碼:409

InternalFailureException

處理音訊時發生問題。Amazon Transcribe 終止處理。

HTTP 狀態碼:500

LimitExceededException

您的客戶已超過 Amazon 轉錄限制之一。這通常是音頻長度限制。將您的音訊串流分成較小的區塊,然後再次嘗試您的要求。

HTTP 狀態碼:429

ServiceUnavailableException

該服務目前無法使用。請稍後再試您的要求。

HTTP 狀態碼:503

另請參閱

如需在語言特定的 AWS 開發套件之一中使用此 API 的詳細資訊,請參閱下列說明: