CreateVocabularyFilter - Transcribe

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

CreateVocabularyFilter

Crea un filtro vocabolario personalizzato.

Puoi utilizzare filtri di vocabolario personalizzati per mascherare, eliminare o contrassegnare parole specifiche dalla trascrizione. I filtri di vocabolario personalizzati sono comunemente usati per mascherare le volgarità nelle trascrizioni.

Ogni lingua ha un set di caratteri che contiene tutti i caratteri consentiti per quella lingua specifica. Se utilizzi caratteri non supportati, la richiesta di filtro del vocabolario personalizzato non riesce. Consulta Set di caratteri per vocabolari personalizzati per ottenere il set di caratteri per la tua lingua.

Per ulteriori informazioni, consulta Filtro vocabolario.

Sintassi della richiesta

{ "LanguageCode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "VocabularyFilterFileUri": "string", "VocabularyFilterName": "string", "Words": [ "string" ] }

Parametri della richiesta

Per informazioni sui parametri comuni a tutte le azioni, vedere Parametri comuni.

La richiesta accetta i seguenti dati in formato JSON.

LanguageCode

Il codice della lingua che rappresenta la lingua delle voci nel filtro del vocabolario. Ogni filtro di vocabolario personalizzato deve contenere termini in una sola lingua.

Un filtro di vocabolario personalizzato può essere utilizzato solo per trascrivere file nella stessa lingua del filtro. Ad esempio, se crei un filtro di vocabolario personalizzato utilizzando l'inglese americano (en-US), puoi applicare questo filtro solo ai file che contengono audio in inglese.

Per un elenco delle lingue supportate e dei codici di lingua associati, consulta la tabella Lingue supportate.

Tipo: String

Valori validi: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Campo obbligatorio: sì

Tags

Aggiunge uno o più tag personalizzati, ciascuno sotto forma di coppia chiave:valore, a un nuovo filtro di vocabolario personalizzato al momento della creazione di questo nuovo filtro di vocabolario.

Per ulteriori informazioni sull'uso dei tag con Amazon Transcribe, consulta Risorse per tag.

Tipo: matrice di oggetti Tag

Membri dell’array: numero minimo di 1 elemento. Numero massimo di 200 elementi.

Required: No

VocabularyFilterFileUri

La posizione Amazon S3 del file di testo che contiene i termini del filtro del vocabolario personalizzato. L'URI deve trovarsi nellaRegione AWS stessa risorsa che stai chiamando.

Ecco un esempio di percorso URI:s3://DOC-EXAMPLE-BUCKET/my-vocab-filter-file.txt

Nota che se includiVocabularyFilterFileUri nella tua richiesta, non puoi usarlaWords; devi scegliere l'uno o l'altro.

Tipo: String

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 2000.

Modello: (s3://|http(s*)://).+

Required: No

VocabularyFilterName

Un nome univoco, scelto da te, per il tuo nuovo filtro di vocabolario personalizzato.

Questo nome fa distinzione tra maiuscole e minuscole, non può contenere spazi e deve essere univoco all'interno di unAccount AWS. Se provi a creare un nuovo filtro di vocabolario personalizzato con lo stesso nome di un filtro di vocabolario personalizzato esistente, ricevi unConflictException errore.

Tipo: String

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

Campo obbligatorio: sì

Words

Usa questo parametro se desideri creare un filtro di vocabolario personalizzato includendo tutti i termini desiderati, come valori separati da virgole, nella tua richiesta. L'altra opzione per creare il filtro del vocabolario consiste nel salvare le voci in un file di testo e caricarle in un bucket Amazon S3, quindi specificare la posizione del file utilizzando ilVocabularyFilterFileUri parametro.

Nota che se includiWords nella tua richiesta, non puoi usarlaVocabularyFilterFileUri; devi scegliere l'uno o l'altro.

Ogni lingua ha un set di caratteri che contiene tutti i caratteri consentiti per quella lingua specifica. Se utilizzi caratteri non supportati, la richiesta di filtro del vocabolario personalizzato non riesce. Consulta Set di caratteri per vocabolari personalizzati per ottenere il set di caratteri per la tua lingua.

Tipo: matrice di stringhe

Membri dell’array: numero minimo di 1 elemento.

Limitazioni di lunghezza: lunghezza minima di 1. La lunghezza massima è 256 caratteri.

Required: No

Sintassi della risposta

{ "LanguageCode": "string", "LastModifiedTime": number, "VocabularyFilterName": "string" }

Elementi di risposta

Se l'operazione riesce, il servizio restituisce una risposta HTTP 200.

I dati seguenti vengono restituiti in formato JSON mediante il servizio.

LanguageCode

Il codice della lingua che hai selezionato per il filtro del vocabolario personalizzato.

Tipo: String

Valori validi: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

LastModifiedTime

La data e l'ora in cui hai creato il filtro del vocabolario personalizzato.

I timestamp sono nel formatoYYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC. Ad esempio,2022-05-04T12:32:58.761000-07:00 rappresenta le 12:32 UTC-7 del 4 maggio 2022.

Tipo: Indicatore orario

VocabularyFilterName

Il nome che hai scelto per il filtro del vocabolario personalizzato.

Tipo: String

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

Errori

Per informazioni sugli errori comuni a tutte le operazioni, consultare Errori comuni.

BadRequestException

La tua richiesta non ha superato uno o più test di convalida. Ciò può verificarsi quando l'entità che stai cercando di eliminare non esiste o se si trova in uno stato non terminale (ad esempioIN PROGRESS). Per ulteriori informazioni, consulta il campo del messaggio di eccezione.

Codice di stato HTTP: 400

ConflictException

Esiste già una risorsa con questo nome. I nomi delle risorse devono essere univoci all'interno diAccount AWS.

Codice di stato HTTP: 400

InternalFailureException

Si è verificato un errore interno. Controlla il messaggio di errore, correggi il problema e riprova con la richiesta.

Codice di stato HTTP: 500

LimitExceededException

Hai inviato troppe richieste o il file di input è troppo lungo. Attendi prima di riprovare la richiesta oppure utilizza un file più piccolo e riprova la richiesta.

Codice di stato HTTP: 400

Vedi anche

Per ulteriori informazioni sull'utilizzo di questa API in uno degli SDK AWS specifici della lingua, consulta quanto segue: