Sprachidentifizierung mit Streaming-Transkriptionen - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Sprachidentifizierung mit Streaming-Transkriptionen

Die Streaming-Sprachidentifizierung kann die in Ihrem Mediendatenstrom vorherrschende Sprache identifizieren. Amazon Transcribe benötigt mindestens drei Sekunden Sprache, um die Sprache zu identifizieren.

Wenn Ihr Stream nur eine Sprache enthält, können Sie die einsprachige Identifizierung aktivieren, die die vorherrschende Sprache in Ihrer Mediendatei identifiziert und Ihr Transkript nur mit dieser Sprache erstellt.

Wenn Ihr Stream mehr als eine Sprache enthält, können Sie die Identifizierung mehrerer Sprachen aktivieren, die alle Sprachen in Ihrem Stream identifiziert und Ihr Transkript unter Verwendung jeder identifizierten Sprache erstellt. Beachten Sie, dass ein mehrsprachiges Transkript erstellt wird. Sie können andere Services wie Amazon Transcribenutzen, um Ihr Transkript zu übersetzen.

Um die Streaming-Sprachidentifizierung zu verwenden, müssen Sie mindestens zwei Sprachcodes angeben, und Sie können nur einen Sprachdialekt pro Sprache und Stream auswählen. Das bedeutet, dass Sie nicht en-US und en-AU als Sprachoptionen für dieselbe Transkription auswählen können.

Sie haben auch die Möglichkeit, eine bevorzugte Sprache aus der Reihe der von Ihnen angegebenen Sprachcodes auszuwählen. Das Hinzufügen einer bevorzugten Sprache kann den Prozess der Sprachidentifizierung beschleunigen, was bei kurzen Audioclips hilfreich ist.

Wichtig

Wenn keiner der von Ihnen angegebenen Sprachcodes mit der Sprache oder den Sprachen übereinstimmt, die in Ihrem Audio identifiziert wurden, wählt Amazon Transcribe die Sprache aus, die den von Ihnen angegebenen Sprachcodes am nächsten kommt. Es wird dann eine Transkription in dieser Sprache erstellt. Wenn Ihre Medien beispielsweise in US-Englisch (en-US) vorliegen und Sie Amazon Transcribe mit den Sprachcodes zh-CN, fr-FR und de-DEversehen, wird Amazon Transcribe Ihre Medien wahrscheinlich mit Deutsch (de-DE) abgleichen und eine deutschsprachige Transkription erstellen. Wenn Sprachcodes und gesprochene Sprachen nicht übereinstimmen, kann dies zu einem ungenauen Transkript führen, weshalb wir bei der Angabe von Sprachcodes zur Vorsicht raten.

Wenn Ihre Medien zwei Kanäle enthalten, kann Amazon Transcribe die vorherrschende Sprache ermitteln, die in jedem Kanal gesprochen wird. In diesem Fall setzen Sie ChannelIdentification auf true und jeder Kanal wird separat transkribiert. Beachten Sie, dass der Standardwert für diesen Parameter false ist. Wenn Sie die Einstellung nicht ändern, wird nur der erste Kanal transkribiert und nur eine Sprache erkannt.

Die Streaming-Sprachidentifizierung kann nicht mit benutzerdefinierten Sprachmodellen oder Schwärzen kombiniert werden. Wenn Sie die Sprachidentifizierung mit anderen Features kombinieren, sind Sie auf die Sprachen beschränkt, die von diesen Features unterstützt werden, und auch auf Streaming-Transkriptionen. Siehe Unterstützte Sprachen.

Anmerkung

PCM und FLAC sind die einzigen unterstützten Audioformate für die Streaming-Sprachidentifizierung.

Identifizierung von Sprachen in mehrsprachigen Audiodateien

Die Identifizierung mehrerer Sprachen ist für mehrsprachige Streams gedacht und bietet Ihnen ein Transkript, das alle unterstützten Sprachen widerspiegelt, die in Ihrem Stream gesprochen werden. Das bedeutet, dass Ihre Transkriptionsausgabe jede Sprache korrekt erkennt und transkribiert, wenn die Sprecher während des Gesprächs die Sprache wechseln oder wenn jeder Teilnehmer eine andere Sprache spricht.

Wenn in Ihrem Stream beispielsweise ein zweisprachiger Sprecher abwechselnd US-Englisch (en-US) und Hindi (hi-IN) spricht, kann die Identifizierung mehrerer Sprachen gesprochenes US-Englisch als en-US und gesprochenes Hindi als hi-IN identifizieren und transkribieren. Dies unterscheidet sich von der einsprachigen Identifizierung, bei der nur eine dominante Sprache zur Erstellung eines Transkripts verwendet wird. In diesem Fall wird jede gesprochene Sprache, die nicht die dominante Sprache ist, falsch transkribiert.

Anmerkung

Schwärzen und benutzerdefinierte Sprachmodelle werden derzeit bei mehrsprachiger Identifizierung nicht unterstützt.

Sprachidentifizierung mit Streaming-Medien nutzen

Sie können die automatische Sprachidentifizierung in einer Streaming-Transkription verwenden, indem Sie AWS Management Console, HTTP/2 oder WebSockets verwenden. Beispiele finden Sie im Folgenden:

  1. Melden Sie sich an der AWS Management Console an.

  2. Wählen Sie im Navigationsbereich Echtzeit-Streaming aus. Blättern Sie nach unten zu den Spracheinstellungen und erweitern Sie dieses Feld, falls es minimiert ist.

    Screenshot der Amazon Transcribe-Konsole: Die Registerkarte „Sprachstellungen“ auf der Seite „Echtzeit-Transkription“.
  3. Wählen Sie Automatische Sprachidentifikation oder Automatische Identifizierung mehrerer Sprachen aus.

    Screenshot der Amazon Transcribe-Konsole: Die erweiterte Registerkarte „Spracheinstellungen“.
  4. Geben Sie mindestens zwei Sprachencodes für Ihre Transkription an. Beachten Sie, dass Sie nur einen Dialekt pro Sprache angeben können. Sie können zum Beispiel nicht sowohl en-US als auch fr-CA als Sprachoptionen für dieselbe Transkription auswählen.

    Screenshot der Amazon Transcribe-Konsole: Dropdown-Menü zur Auswahl des Sprachcodes.
  5. (Optional) Aus der Teilmenge der Sprachen, die Sie im vorherigen Schritt ausgewählt haben, können Sie eine bevorzugte Sprache für Ihr Transkript auswählen.

    Screenshot der Amazon Transcribe-Konsole: der Bereich „Spracheinstellungen“ mit den bevorzugten Sprachoptionen.
  6. Jetzt können Sie Ihren Stream transkribieren. Wählen Sie Streaming starten und beginnen Sie zu sprechen. Um Ihr Diktat zu beenden, wählen Sie Streaming beenden.

In diesem Beispiel wird eine HTTP/2-Anfrage mit aktivierter Sprachidentifizierung erstellt. Weitere Informationen zur Verwendung von HTTP/2-Streaming mit Amazon Transcribe finden Sie unter Einrichten eines HTTP/2-Streams. Weitere Einzelheiten zu Parametern und Kopfzeilen, die speziell für Amazon Transcribe gelten, finden Sie unter StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-language: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

In diesem Beispiel wird eine HTTP/2-Anfrage mit aktivierter Identifizierung mehrerer Sprachen erstellt. Weitere Informationen zur Verwendung von HTTP/2-Streaming mit Amazon Transcribe finden Sie unter Einrichten eines HTTP/2-Streams. Weitere Einzelheiten zu Parametern und Kopfzeilen, die speziell für Amazon Transcribe gelten, finden Sie unter StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-multiple-languages: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

Wenn Sie identify-language oder identify-multiple-languages in Ihrer Anforderung verwenden, müssen Sie auch language-options angeben. Sie können nicht sowohl language-code als auch identify-language in derselben Anfrage verwenden.

Parameterdefinitionen finden Sie in der API-Referenz; Parameter, die allen AWS-API-Vorgängen gemeinsam sind, werden im Abschnitt Allgemeine Parameter aufgeführt.

In diesem Beispiel wird eine vordefinierte URL erstellt, die die Sprachidentifikation in einem WebSocket-Stream verwendet. Für eine bessere Lesbarkeit werden Zeilenumbrüche hinzugefügt. Weitere Informationen zur Verwendung von WebSocket-Streams mit Amazon Transcribe finden Sie unter Einen WebSocket Stream einrichten. Weitere Einzelheiten zu den Parametern finden Sie unter StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-language=true &language-options=en-US,de-DE &preferred-language=en-US

In diesem Beispiel wird eine vorsignierte URL erstellt, die die Identifizierung mehrerer Sprachen in einem WebSocket-Stream verwendet. Für eine bessere Lesbarkeit werden Zeilenumbrüche hinzugefügt. Weitere Informationen zur Verwendung von WebSocket-Streams mit Amazon Transcribe finden Sie unter Einen WebSocket Stream einrichten. Weitere Einzelheiten zu den Parametern finden Sie unter StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-multiple-languages=true &language-options=en-US,de-DE &preferred-language=en-US

Wenn Sie identify-language oder identify-multiple-languages in Ihrer Anforderung verwenden, müssen Sie auch language-options angeben. Sie können nicht sowohl language-code als auch identify-language in derselben Anfrage verwenden.

Parameterdefinitionen finden Sie in der API-Referenz; Parameter, die allen AWS-API-Vorgängen gemeinsam sind, werden im Abschnitt Allgemeine Parameter aufgeführt.