StartMedicalStreamTranscription - Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

StartMedicalStreamTranscription

Startet einen bidirektionalen WebSocket HTTP/2-Stream, bei dem Audio an Amazon Transcribe Medical und die Transkriptionsergebnisse an Ihre Anwendung gestreamt werden.

Die folgenden Parameter sind erforderlich:

  • language-code

  • media-encoding

  • sample-rate

Weitere Informationen zum Streamen mit Amazon Transcribe Medical finden Sie unter Transkribieren von Streaming-Audio.

Anforderungssyntax

POST /medical-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob } } }

URI-Anfrageparameter

Die Anforderung verwendet die folgenden URI-Parameter.

ContentIdentificationType

Kennzeichnet alle persönlichen Gesundheitsdaten (PHI), die in Ihrem Transkript angegeben sind.

Die Inhaltsidentifikation erfolgt auf Segmentebene. PHI wird nach vollständiger Transkription eines Audiosegments gekennzeichnet.

Weitere Informationen finden Sie unter Identifizieren persönlicher Gesundheitsinformationen (PHI) in einer Transkription.

Zulässige Werte: PHI

EnableChannelIdentification

Aktiviert die Kanalidentifikation bei Mehrkanal-Audio.

Die Kanalidentifikation transkribiert das Audio auf jedem Kanal unabhängig und fügt dann die Ausgabe für jeden Kanal in ein Transkript an.

Wenn Sie Mehrkanal-Audio verwenden und die Kanalidentifikation nicht aktivieren, wird Ihr Audio kontinuierlich transkribiert und Ihr Transkript ist nicht nach Kanälen getrennt.

Wenn Sie Ihre AnfrageEnableChannelIdentification einschließen, müssen Sie auch einschließenNumberOfChannels.

Weitere Informationen finden Sie unter Transkriptionierung von Mehrkanal-Audio.

LanguageCode

Geben Sie den Sprachcode an, der die in Ihrem Audio gesprochene Sprache darstellt.

Wichtig

Amazon Transcribe Medical unterstützt nur US-Englisch (en-US).

Zulässige Werte: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

Erforderlich: Ja

MediaEncoding

Geben Sie die Kodierung an, die für das Eingangs-Audio verwendet wird. Unterstützte Formate sind:

  • FLAC

  • OPUS-kodiertes Audio in einem Ogg-Container

  • PCM (nur signierte 16-Bit-Little-Endian-Audioformate, die WAV nicht enthalten)

Weitere Informationen finden Sie unter Medienformate.

Zulässige Werte: pcm | ogg-opus | flac

Erforderlich: Ja

MediaSampleRateHertz

Die Samplerate des Eingangs-Audios (in Hertz). Amazon Transcribe Medical unterstützt einen Bereich von 16.000 Hz bis 48.000 Hz. Beachten Sie, dass die von Ihnen angegebene Samplerate mit der Ihres Audios übereinstimmen muss.

Gültiger Bereich: Mindestwert 8000. Maximaler Wert von 48000.

Erforderlich: Ja

NumberOfChannels

Geben Sie die Anzahl der Kanäle in Ihrem Audiostream an. Dieser Wert muss sein2, da nur zwei Kanäle unterstützt werden. Wenn Ihr Audio nicht mehrere Kanäle enthält, nehmen Sie diesen Parameter nicht in Ihre Anfrage auf.

Wenn Sie Ihre AnfrageNumberOfChannels einschließen, müssen Sie auch einschließenEnableChannelIdentification.

Gültiger Bereich: Mindestwert 2.

SessionId

Geben Sie einen Namen für Ihre Transkriptionssitzung an. Wenn Sie diesen Parameter nicht in Ihre Anfrage aufnehmen, generiert Amazon Transcribe Medical eine ID und gibt sie in der Antwort zurück.

Längenbeschränkungen: Feste Länge von 36.

Pattern: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Aktiviert die Lautsprecherpartitionierung (Diarisierung) in Ihrer Transkriptionsausgabe. Die Lautsprecherpartitionierung kennzeichnet die Sprache einzelner Lautsprecher in Ihrer Mediendatei.

Weitere Informationen finden Sie unter Partitionierung von Lautsprechern (Diarisierung).

Specialty

Geben Sie die medizinische Fachrichtung an, die in Ihrem Audio enthalten ist.

Zulässige Werte: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Erforderlich: Ja

Type

Geben Sie die Art des Eingangs-Audios an. Wählen SieDICTATION beispielsweise einen Anbieter, der die Patientennotizen diktiert, undCONVERSATION für einen Dialog zwischen einem Patienten und einem medizinischen Fachpersonal.

Zulässige Werte: CONVERSATION | DICTATION

Erforderlich: Ja

VocabularyName

Geben Sie den Namen des benutzerdefinierten Vokabulars an, das Sie bei der Verarbeitung Ihrer Transkription verwenden möchten. Beachten Sie, dass bei Vokabelnamen zwischen Groß- und Kleinschreibung unterschieden wird.

Längenbeschränkungen: Minimale Länge von 1. Höchstlänge = 200 Zeichen.

Pattern: ^[0-9a-zA-Z._-]+

Anforderungstext

Die Anforderung akzeptiert die folgenden Daten im JSON-Format.

AudioStream

Ein kodierter Stream von Audio-Blobs. Audiostreams werden entweder als HTTP/2 oder als WebSocket Datenrahmen codiert.

Weitere Informationen finden Sie unter Transkriptionierung von Streaming-Audio.

Typ: AudioStream Objekt

Erforderlich: Ja

Antwortsyntax

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "TranscriptResultStream": { "BadRequestException": { }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Entities": [ { "Category": "string", "Confidence": number, "Content": "string", "EndTime": number, "StartTime": number } ], "Items": [ { "Confidence": number, "Content": "string", "EndTime": number, "Speaker": "string", "StartTime": number, "Type": "string" } ], "Transcript": "string" } ], "ChannelId": "string", "EndTime": number, "IsPartial": boolean, "ResultId": "string", "StartTime": number } ] } } } }

Antwortelemente

Wenn die Aktion erfolgreich ist, sendet der Service eine HTTP 200-Antwort zurück.

Die Antwort gibt die folgenden HTTP-Header zurück.

ContentIdentificationType

Zeigt an, ob die Inhaltsidentifikation für Ihre Transkription aktiviert wurde.

Zulässige Werte: PHI

EnableChannelIdentification

Zeigt an, ob die Kanalidentifikation für Ihre Transkription aktiviert wurde.

LanguageCode

Stellt den Sprachcode bereit, den Sie in Ihrer Anfrage angegeben haben. Dies muss en-US lauten.

Zulässige Werte: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

MediaEncoding

Stellt die Medienkodierung bereit, die Sie in Ihrer Anfrage angegeben haben.

Zulässige Werte: pcm | ogg-opus | flac

MediaSampleRateHertz

Gibt die Samplerate an, die Sie in Ihrer Anfrage angegeben haben.

Gültiger Bereich: Mindestwert 8000. Maximaler Wert von 48000.

NumberOfChannels

Gibt die Anzahl der Kanäle an, die Sie in Ihrer Anfrage angegeben haben.

Gültiger Bereich: Mindestwert 2.

RequestId

Stellt die Kennung für Ihre Streaming-Anfrage bereit.

SessionId

Stellt die Kennung für Ihre Transkriptionssitzung bereit.

Längenbeschränkungen: Feste Länge von 36.

Pattern: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Zeigt an, ob die Lautsprecherpartitionierung für Ihre Transkription aktiviert wurde.

Specialty

Gibt das medizinische Fachgebiet an, das Sie in Ihrer Anfrage angegeben haben.

Zulässige Werte: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Type

Stellt den Audiotyp bereit, den Sie in Ihrer Anfrage angegeben haben.

Zulässige Werte: CONVERSATION | DICTATION

VocabularyName

Gibt den Namen des benutzerdefinierten Vokabulars an, das Sie in Ihrer Anfrage angegeben haben.

Längenbeschränkungen: Minimale Länge von 1. Höchstlänge = 200 Zeichen.

Pattern: ^[0-9a-zA-Z._-]+

Die folgenden Daten werden vom Service im JSON-Format zurückgegeben.

TranscriptResultStream

Bietet detaillierte Informationen zu Ihrer Streaming-Sitzung.

Typ: MedicalTranscriptResultStream Objekt

Fehler

Hinweise zu den Fehlern, die allen Aktionen gemeinsam sind, finden Sie unterHäufige Fehler.

BadRequestException

Ein oder mehrere Argumente für dieStartCallAnalyticsStreamTranscription OperationStartStreamTranscriptionStartMedicalStreamTranscription,, oder waren nicht gültig. Zum BeispielMediaEncoding oderLanguageCode verwendete nicht unterstützte Werte. Überprüfen Sie die angegebenen Parameter und versuchen Sie es erneut mit Ihrer Anfrage.

HTTP Status Code: 400

ConflictException

Ein neuer Stream wurde mit derselben Sitzungs-ID gestartet. Der aktuelle Stream wurde beendet.

HTTP-Statuscode: 409

InternalFailureException

Bei der Verarbeitung des Audios ist ein Problem aufgetreten. Amazon Transcribe hat die Verarbeitung beendet.

HTTP Status Code: 500

LimitExceededException

Ihr Kunde hat eines der Amazon Transcribe Transcribe-Grenzwerte überschritten. Dies ist normalerweise die Audiolängenbeschränkung. Teilen Sie Ihren Audiostream in kleinere Teile auf und versuchen Sie es erneut mit Ihrer Anfrage.

HTTP-Statuscode: 429

ServiceUnavailableException

Der Service ist derzeit nicht verfügbar. Versuchen Sie Ihre Abfrage später erneut.

HTTP Status Code: 503

Weitere Informationen finden Sie unter:

Weitere Informationen zur Verwendung dieser API in einem der sprachspezifischen AWS-SDKs finden Sie unter: