Benutzerdefinierte Vokabulare - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Benutzerdefinierte Vokabulare

Verwenden Sie benutzerdefinierte Vokabulare, um die Transkriptionsgenauigkeit für ein bestimmtes Wort oder mehrere bestimmte Wörter zu verbessern. Dabei handelt es sich in der Regel um bereichsspezifische Begriffe wie Markennamen und Akronyme, Eigennamen und Wörter, die von Amazon Transcribe nicht korrekt wiedergegeben werden.

Benutzerdefinierte Vokabulare können mit allen unterstützten Sprachen verwendet werden. Beachten Sie, dass nur die im Zeichensatz Ihrer Sprache aufgeführten Zeichen in einem benutzerdefinierten Vokabular verwendet werden können.

Wichtig

Sie sind für die Integrität Ihrer eigenen Daten verantwortlich, wenn Sie Amazon Transcribe verwenden. Geben Sie keine vertraulichen Daten, personenbezogene Daten (PII) oder geschützte Gesundheitsinformationen (PHI) in ein benutzerdefiniertes Vokabular ein.

Überlegungen bei der Erstellung eines benutzerdefinierten Vokabulars:

  • Sie können bis zu 100 benutzerdefinierte Vokabeldateien pro Datei haben AWS-Konto

  • Die Größe jeder benutzerdefinierten Vokabulardatei ist auf 50 Kb begrenzt

  • Wenn Sie Ihr benutzerdefiniertes Vokabular über die API erstellen, muss Ihre Vokabulardatei im Textformat (*.txt) vorliegen. Wenn Sie das verwenden AWS Management Console, kann Ihre Vokabeldatei im Textformat (*.txt) oder im Format mit kommagetrennten Werten (*.csv) vorliegen.

  • Jeder Eintrag innerhalb eines benutzerdefinierten Vokabulars darf nicht länger als 256 Zeichen sein

  • Um ein benutzerdefiniertes Vokabular verwenden zu können, muss es in derselben AWS-Region Weise wie Ihre Transkription erstellt worden sein.

Tipp

Sie können Ihr benutzerdefiniertes Vokabular mit dem AWS Management Console testen. Sobald Ihr benutzerdefiniertes Vokabular einsatzbereit ist, melden Sie sich bei an AWS Management Console, wählen Sie Echtzeit-Transkription, scrollen Sie zu Anpassungen, schalten Sie Benutzerdefiniertes Vokabular ein und wählen Sie Ihr benutzerdefiniertes Vokabular aus der Dropdownliste aus. Wählen Sie dann Streaming starten. Sprechen Sie einige der Wörter aus Ihrem benutzerdefinierten Vokabular in Ihr Mikrofon, um zu sehen, ob sie korrekt wiedergegeben werden.

Benutzerdefinierte Vokabulartabellen versus Listen

Wichtig

Benutzerdefinierte Vokabulare im Listenformat werden nicht mehr verwendet. Wenn Sie ein neues benutzerdefiniertes Vokabular erstellen, verwenden Sie das Tabellenformat.

Tabellen bieten Ihnen mehr Optionen für die Eingabe und Ausgabe von Wörtern innerhalb Ihres benutzerdefinierten Vokabulars – und mehr Kontrolle darüber. Bei Tabellen müssen Sie mehrere Kategorien angeben (Phrase and DisplayAs), sodass Sie Ihre Ausgabe feiner abstimmen können.

Listen haben keine zusätzlichen Optionen, sodass Sie nur Einträge so eingeben können, wie sie in Ihrer Transkript erscheinen sollen, wobei alle Leerzeichen durch Bindestriche ersetzt werden.

Die AWS SDKs AWS Management Console AWS CLI, und verwenden benutzerdefinierte Vokabeltabellen auf die gleiche Weise. Listen werden für jede Methode unterschiedlich verwendet und erfordern daher möglicherweise zusätzliche Formatierungen, um erfolgreich zwischen den Methoden verwendet werden zu können.

Weitere Informationen finden Sie unter Erstellen eines benutzerdefinierten Vokabulars mithilfe einer Tabelle und Erstellen eines benutzerdefinierten Vokabulars mithilfe einer Liste.

Wenn Sie etwas tiefer eintauchen und erfahren möchten, wie Sie Amazon Augmented AI mit benutzerdefinierten Vokabularen verwenden können, finden Sie weitere Informationen unter:

API-Vorgänge speziell für benutzerdefinierte Vokabulare