Identifizierung von Sprachen in mehrsprachigen Audiodateien Sprachidentifizierung mit Streaming-Medien nutzen

Sprachidentifizierung mit Streaming-Transkriptionen

Durch die Identifizierung der Streaming-Sprache kann die dominante Sprache identifiziert werden, die in Ihrem Medienstream gesprochen wird. Amazon Transcribe benötigt mindestens eine Sekunde Sprachzeit, um die Sprache zu identifizieren.

Wenn Ihr Stream nur eine Sprache enthält, können Sie die einsprachige Identifizierung aktivieren, die die vorherrschende Sprache in Ihrer Mediendatei identifiziert und Ihr Transkript nur mit dieser Sprache erstellt.

Wenn Ihr Stream mehr als eine Sprache enthält, können Sie die Identifizierung mehrerer Sprachen aktivieren, die alle Sprachen in Ihrem Stream identifiziert und Ihr Transkript unter Verwendung jeder identifizierten Sprache erstellt. Beachten Sie, dass ein mehrsprachiges Transkript erstellt wird. Sie können andere Dienste verwenden, z. B. Amazon Transcribe um Ihr Transkript zu übersetzen.

Um die Streaming-Sprachidentifizierung zu verwenden, müssen Sie mindestens zwei Sprachcodes angeben, und Sie können nur einen Sprachdialekt pro Sprache und Stream auswählen. Das bedeutet, dass Sie nicht en-US und en-AU als Sprachoptionen für dieselbe Transkription auswählen können.

Sie haben auch die Möglichkeit, eine bevorzugte Sprache aus der Reihe der von Ihnen angegebenen Sprachcodes auszuwählen. Das Hinzufügen einer bevorzugten Sprache kann den Prozess der Sprachidentifizierung beschleunigen, was bei kurzen Audioclips hilfreich ist.

Wichtig

Wenn keiner der von Ihnen angegebenen Sprachcodes mit der Sprache oder den Sprachen übereinstimmt, die in Ihrem Audio identifiziert wurden, wird aus den von Ihnen angegebenen Sprachcodes die Sprache Amazon Transcribe ausgewählt, die am ehesten entspricht. Es wird dann eine Transkription in dieser Sprache erstellt. Wenn Ihre Medien beispielsweise in US-Englisch (en-US) verfasst sind und Sie die Sprachcodes angeben, Amazon Transcribe ist es wahrscheinlich zh-CNfr-FR, dass Ihre Medien Amazon Transcribe mit Deutsch (de-DE) übereinstimmen und eine deutschsprachige Transkription erstellt wird. de-DE Wenn Sprachcodes und gesprochene Sprachen nicht übereinstimmen, kann dies zu einem ungenauen Transkript führen, weshalb wir bei der Angabe von Sprachcodes zur Vorsicht raten.

Wenn Ihre Medien zwei Kanäle enthalten, Amazon Transcribe kann die dominante Sprache, die in jedem Kanal gesprochen wird, identifiziert werden. In diesem Fall setzen Sie ChannelIdentification auf true und jeder Kanal wird separat transkribiert. Beachten Sie, dass der Standardwert für diesen Parameter false ist. Wenn Sie die Einstellung nicht ändern, wird nur der erste Kanal transkribiert und nur eine Sprache erkannt.

Die Streaming-Sprachidentifizierung kann nicht mit benutzerdefinierten Sprachmodellen oder Schwärzen kombiniert werden. Wenn Sie die Sprachidentifizierung mit anderen Features kombinieren, sind Sie auf die Sprachen beschränkt, die von diesen Features unterstützt werden, und auch auf Streaming-Transkriptionen. Siehe Unterstützte Sprachen.

Anmerkung

PCM und FLAC sind die einzigen unterstützten Audioformate für die Streaming-Sprachidentifizierung. Für die mehrsprachige Identifizierung wird nur PCM unterstützt.

Identifizierung von Sprachen in mehrsprachigen Audiodateien

Die Identifizierung mehrerer Sprachen ist für mehrsprachige Streams gedacht und bietet Ihnen ein Transkript, das alle unterstützten Sprachen widerspiegelt, die in Ihrem Stream gesprochen werden. Das bedeutet, dass Ihre Transkriptionsausgabe jede Sprache korrekt erkennt und transkribiert, wenn die Sprecher während des Gesprächs die Sprache wechseln oder wenn jeder Teilnehmer eine andere Sprache spricht.

Wenn in Ihrem Stream beispielsweise ein zweisprachiger Sprecher abwechselnd US-Englisch (en-US) und Hindi (hi-IN) spricht, kann die Identifizierung mehrerer Sprachen gesprochenes US-Englisch als en-US und gesprochenes Hindi als hi-IN identifizieren und transkribieren. Dies unterscheidet sich von der einsprachigen Identifizierung, bei der nur eine dominante Sprache zur Erstellung eines Transkripts verwendet wird. In diesem Fall wird jede gesprochene Sprache, die nicht die dominante Sprache ist, falsch transkribiert.

Anmerkung

Schwärzen und benutzerdefinierte Sprachmodelle werden derzeit bei mehrsprachiger Identifizierung nicht unterstützt.

Sprachidentifizierung mit Streaming-Medien nutzen

Sie können die automatische Sprachenerkennung in einer Streaming-Transkription mithilfe von HTTP/2 oder verwenden. Beispiele finden WebSocketsSie im Folgenden: AWS Management Console

Melden Sie sich an der AWS Management Console an.
Wählen Sie im Navigationsbereich Echtzeit-Streaming aus. Blättern Sie nach unten zu den Spracheinstellungen und erweitern Sie dieses Feld, falls es minimiert ist.
Wählen Sie Automatische Sprachidentifikation oder Automatische Identifizierung mehrerer Sprachen aus.
Geben Sie mindestens zwei Sprachencodes für Ihre Transkription an. Beachten Sie, dass Sie nur einen Dialekt pro Sprache angeben können. Sie können zum Beispiel nicht sowohl en-US als auch fr-CA als Sprachoptionen für dieselbe Transkription auswählen.
(Optional) Aus der Teilmenge der Sprachen, die Sie im vorherigen Schritt ausgewählt haben, können Sie eine bevorzugte Sprache für Ihr Transkript auswählen.
Jetzt können Sie Ihren Stream transkribieren. Wählen Sie Streaming starten und beginnen Sie zu sprechen. Um Ihr Diktat zu beenden, wählen Sie Streaming beenden.

In diesem Beispiel wird eine HTTP/2-Anfrage mit aktivierter Sprachidentifizierung erstellt. Weitere Informationen zur Verwendung von HTTP/2-Streaming mit finden Sie unter. Amazon TranscribeEinrichten eines HTTP/2-Streams Weitere Informationen zu spezifischen Parametern und Headern finden Sie Amazon Transcribe unter. StartStreamTranscription


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-language: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked

In diesem Beispiel wird eine HTTP/2-Anfrage mit aktivierter Identifizierung mehrerer Sprachen erstellt. Weitere Informationen zur Verwendung von HTTP/2-Streaming mit finden Sie Amazon Transcribe unter. Einrichten eines HTTP/2-Streams Weitere Informationen zu spezifischen Parametern und Headern finden Sie Amazon Transcribe unter. StartStreamTranscription


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-multiple-languages: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked

Wenn Sie identify-language oder identify-multiple-languages in Ihrer Anforderung verwenden, müssen Sie auch language-options angeben. Sie können nicht sowohl language-code als auch identify-language in derselben Anfrage verwenden.

Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allen AWS API-Vorgängen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.

In diesem Beispiel wird eine vorsignierte URL erstellt, die die Sprachenidentifikation in einem WebSocket Stream verwendet. Für eine bessere Lesbarkeit werden Zeilenumbrüche hinzugefügt. Weitere Informationen zur Verwendung von WebSocket Streams mit finden Sie Amazon Transcribe unterEinen WebSocket Stream einrichten. Weitere Einzelheiten zu den Parametern finden Sie unter StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-language=true
&language-options=en-US,de-DE
&preferred-language=en-US

In diesem Beispiel wird eine vorsignierte URL erstellt, die die Identifizierung mehrerer Sprachen in einem WebSocket Stream verwendet. Für eine bessere Lesbarkeit werden Zeilenumbrüche hinzugefügt. Weitere Informationen zur Verwendung von WebSocket Streams mit finden Sie Amazon Transcribe unterEinen WebSocket Stream einrichten. Weitere Einzelheiten zu den Parametern finden Sie unter StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-multiple-languages=true
&language-options=en-US,de-DE
&preferred-language=en-US

Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allen AWS API-Vorgängen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Batch-Sprachidentifizierung

Alternative Transkriptionen