Was ist Amazon Transcribe? - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Was ist Amazon Transcribe?

Amazon Transcribe verwendet erweiterte Machine Learning-Technologien, um Gesprochenes in Audio- oder Videodaten zu erkennen und als Text zu transkribieren. Sie können Amazon Transcribe verwenden, um Audioausgaben in Text zu konvertieren und Anwendungen zu erstellen, die den Inhalt von Audiodateien enthalten. Sie können beispielsweise die Audiospur eines Videos transkribieren, um Untertitel für das Video zu erstellen.

Sie können Amazon Transcribe auch Videodateien bereitstellen und das Audio direkt aus diesen Dateien transkribieren. Beispielsweise können Sie Amazon Transcribe mit einer MP4-Videodatei bereitstellen, und die Audiodatei wird direkt aus dieser Datei transkribiert. Informationen zu den verfügbaren Dateicontainern und -formaten finden Sie unterSpracheingabeaus.

In der folgenden Liste sind die für die Batch-Transkription verfügbaren Sprachen aufgeführt. Jede Sprache hat ihre eigeneSprachcode, die in den Klammern neben der Sprache angezeigt wird. Sie verwenden den Sprachcode, um die Sprache Ihrer Audio- oder Videodatei anzugeben.

  • Golf-Arabisch (ar-AE)

  • Modernes Hocharabisch (ar-SA)

  • Chinesisches Mandarin — Festland (zh-CN)

  • Niederländisch (nl-NL)

  • Australisches Englisch (en-AU)

  • Britisches Englisch (en-GB)

  • Indisches Englisch (es-IN)

  • Irisches Englisch (en-IE)

  • Schottisches Englisch (en-AB)

  • US-Englisch (en-US)

  • Walisisches Englisch (en-WL)

  • Spanisch (es-ES)

  • US-amerikanisches Spanisch (es-US)

  • Französisch (fr-FR)

  • Kanadisches Französisch (fr-CA)

  • Persisches Farsi (fa-IR)

  • Deutsch (de-DE)

  • Schweizerdeutsch (de-CH)

  • Hebräisch (he-IL)

  • Indisches Hindi (Hi-IN)

  • Indonesisch (id-ID)

  • Italienisch (it-IT)

  • Japanisch (ja-JP)

  • Koreanisch (ko-KR)

  • Malaiisch (ms-My)

  • Portugiesisch (pt-PT)

  • Brasilianisches Portugiesisch (pt-BR)

  • Russisch (ru-RU)

  • Tamilisch (ta-IN)

  • Telugu (te-In)

  • Türkisch (tr-TR)

Sie können gestreamte Audiodateien in den folgenden Sprachen transkribieren. Wenn Sie eine Sprache in Ihrem Echtzeit-Stream festlegen möchten, verwenden Sie einSprachcodeaus. Die Sprachcodes werden in Klammern neben den Sprachen angezeigt.

  • Chinesisches Mandarin — Festland (zh-Ch)

  • Australisches Englisch (en-AU)

  • Britisches Englisch (en-GB)

  • US-Englisch (en-US)

  • Französisch (fr-FR)

  • Kanadisches Französisch (fr-CA)

  • Deutsch (de-DE)

  • Italienisch (it-IT)

  • Japanisch (ja-JP)

  • Koreanisch (ko-KR)

  • Brasilianisches Portugiesisch (pt-BR)

  • US-amerikanisches Spanisch (es-US)

Sie können Amazon Transcribe mit anderen AWS-Services kombinieren, um Anwendungen zu erstellen. Beispielsweise können Sie:

  • Nutzen Sie Amazon Transcribe, um Gesprochenes in Text zu konvertieren. Senden Sie den Text an Amazon Translate, um ihn in eine andere Sprache zu übersetzen und übermitteln Sie den übersetzten Text dann an Amazon Polly, um ihn als Audiodatei wiederzugeben.

  • Verwenden Sie Amazon Transcribe, um Aufzeichnungen von Kundenanrufe beim Kundenservice für Analysen zu transkribieren. Senden Sie nach dem Transkribieren einer Aufzeichnung die Transkription an Amazon Comprehend, um Schlüsselwörter, Themen oder Gefühle identifizieren zu lassen.

  • Verwenden Sie Amazon Transcribe, um Live-Übertragungen wie z. B. Fernsehen zu transkribieren, um Echtzeit-Untertitel zur Verfügung zu stellen. Amazon Transcribe erfordert möglicherweise zusätzliche Anpassungen oder menschliche Aufsicht für Broadcast-Grade-Anwendungen.

Wenn Sie Amazon Transcribe verwenden möchten, speichern Sie Ihre Audiodatei in einem Amazon S3 Bucket. Die Ausgabe des Transkriptionsauftrags wird auch in einem S3-Bucket gespeichert. Inhalte, die an Amazon S3 Buckets geliefert werden, können Kundeninhalte enthalten. Weitere Informationen zum Entfernen vertraulicher Daten finden Sie unterWie leere ich einen S3-Bucket?oderWie lösche ich einen S3-Bucket?aus.

Erkennen von Stimmen

Amazon Transcribe kann einzelne Sprecher in einem Audioclip identifizieren, eine Technik, die alsDiarization Sprecheraus. Wenn Sie Sprecherialisierung aktivieren, schließt Amazon Transcribe ein Attribut ein, durch das die einzelnen Sprecher in einem Audioclip identifiziert werden. Sie können mit Sprecherifizierung für folgende Zwecke verwenden:

  • Identifizieren des Kunden und des Supportmitarbeiters in einem aufgezeichneten Anruf beim Kunden-Support

  • Identifizieren von Buchstaben für Untertitel

  • Identifizieren von Sprecher und Fragestellern in einer aufgezeichneten Pressekonferenz oder Vorlesung

Sie können die Anzahl der Stimmen festlegen, die Amazon Transcribe in einem Audioclip erkennen soll.

Transkribieren von separaten Audiokanälen

Verwenden Sie zum Erstellen eines Transkripts für jeden Kanal oder eines einzelnen Streams aufgenommener Audiodaten die Kanalidentifizierung. Mit Kanalidentifizierung gibt Amazon Transcribe zwei oder mehr Transkriptionen aus: eine kombinierte Transkription aller Audiokanäle und eine Transkription jedes Audiokanals.

Verwenden Sie die Kanalidentifizierung, wenn Ihre Audiodaten auf mehrere Kanäle aufgeteilt sind. Verwenden Sie die Kanalidentifizierung z. B.:

  • Wenn in Ihrer Aufzeichnung ein Kundendienstmitarbeiter auf einem Kanal und ein Kunde auf einem anderen spricht

  • Wenn Sie einen Podcast transkribieren, bei dem der Gastgeber auf einem Kanal und der Gast auf einem anderen aufgezeichnet wurden

Weitere Informationen zur Kanalidentifizierung finden Sie unter Transkribieren von Mehrkanal-Audio.

Transkribieren gestreamter Audiodaten

Sie können Amazon Transcribe verwenden, um gestreamte Audiodaten in Echtzeit transkribieren. Sie senden Amazon Transcribe einen Stream von Audiodaten und Amazon Transcribe gibt einen Stream von JSON-Objekten mit der Transkription der Audiodaten zurück.

Weitere Informationen zum Verarbeiten von Audio-Streams finden Sie unter Streaming-Transkription.

Benutzerdefiniertes Vokabular

Erstellen Sie ein benutzerdefiniertes Vokabular, sodass Amazon Transcribe Wörter erkennt, die für Ihren Anwendungsfall spezifisch sind und die Genauigkeit der Konvertierung von Sprache in Text verbessert wird. Sie können beispielsweise ein benutzerdefiniertes Vokabular erstellen, das branchenspezifische Wörter und Phrasen enthält.

Verwenden Sie ein benutzerdefiniertes Vokabular, sodass Amazon Transcribe Folgendes erkennt:

  • Wörter erkennt, die vorher nicht erkannt wurden

  • unbekannte Wörter erkennt, die für Ihre Domäne spezifisch sind

Weitere Informationen zum Erstellen eines benutzerdefinierten Vokabulars finden Sie unter Benutzerdefiniertes Vokabular.

Verwenden Sie Amazon Transcribe zum ersten Mal?

Wenn Sie erstmaliger Benutzer sind, empfehlen wir, die folgenden Abschnitte in der angegebenen Reihenfolge zu lesen:

  1. Funktionsweise von Amazon Transcribe— Einführung in Amazon Transcribe.

  2. Erste Schritte mit Amazon Transcribe: Erläutert, wie Sie das AWS Konto einrichten und Amazon Transcribe verwenden.

  3. API-Referenz: Referenzinformationen zu den Amazon Transcribe -Operationen.