CreateVocabularyFilter - Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

CreateVocabularyFilter

Crée un filtre de vocabulaire personnalisé.

Vous pouvez utiliser des filtres de vocabulaire personnalisés pour masquer, supprimer ou signaler des mots spécifiques de votre transcription. Les filtres de vocabulaire personnalisés sont couramment utilisés pour masquer les grossièretés dans les transcriptions.

Chaque langue possède un jeu de caractères qui contient tous les caractères autorisés pour cette langue spécifique. Si vous utilisez des caractères non pris en charge, votre demande de filtre de vocabulaire personnalisé échoue. Reportez-vous à la section Jeux de caractères pour les vocabulaires personnalisés pour obtenir le jeu de caractères correspondant à votre langue.

Pour de plus amples informations, consultez Filtrage du vocabulaire.

Syntaxe de la requête

{ "LanguageCode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "VocabularyFilterFileUri": "string", "VocabularyFilterName": "string", "Words": [ "string" ] }

Paramètres de demande

Pour plus d'informations sur les paramètres communs à toutes les actions, voir Paramètres communs.

Cette demande accepte les données suivantes au format JSON.

LanguageCode

Code de langue qui représente la langue des entrées de votre filtre de vocabulaire. Chaque filtre de vocabulaire personnalisé doit contenir des termes dans une seule langue.

Un filtre de vocabulaire personnalisé ne peut être utilisé que pour transcrire des fichiers dans la même langue que le filtre. Par exemple, si vous créez un filtre de vocabulaire personnalisé à l'aide de l'anglais américain (en-US), vous ne pouvez appliquer ce filtre qu'aux fichiers contenant du son en anglais.

Pour obtenir la liste des langues prises en charge et leurs codes de langue associés, consultez le tableau des langues prises en charge.

Type : String

Valeurs valides : af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Obligatoire : oui

Tags

Ajoute une ou plusieurs balises personnalisées, chacune sous la forme d'une paire clé:valeur, à un nouveau filtre de vocabulaire personnalisé au moment où vous créez ce nouveau filtre de vocabulaire.

Pour en savoir plus sur l'utilisation des balises avec Amazon Transcribe, consultez Ressources de balisage.

Type : tableau d’objets Tag

Membres du tableau : Nombre minimum de 1 élément. Nombre maximum de 200 éléments.

Obligatoire : non

VocabularyFilterFileUri

L'emplacement Amazon S3 du fichier texte contenant les termes de votre filtre de vocabulaire personnalisé. L'URI doit se situer dans le même emplacementRégion AWS que la ressource que vous appelez.

Voici un exemple de chemin d'URI :s3://DOC-EXAMPLE-BUCKET/my-vocab-filter-file.txt

Notez que si vous l'incluezVocabularyFilterFileUri dans votre demande, vous ne pouvez pas utiliserWords ; vous devez choisir l'un ou l'autre.

Type : String

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 2000.

Modèle : (s3://|http(s*)://).+

Obligatoire : non

VocabularyFilterName

Un nom unique, que vous avez choisi, pour votre nouveau filtre de vocabulaire personnalisé.

Ce nom distingue les majuscules des minuscules, ne peut pas contenir d'espaces et doit être unique au sein d'unCompte AWS. Si vous essayez de créer un nouveau filtre de vocabulaire personnalisé portant le même nom qu'un filtre de vocabulaire personnalisé existant, vous obtenez uneConflictException erreur.

Type : String

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

Obligatoire : oui

Words

Utilisez ce paramètre si vous souhaitez créer votre filtre de vocabulaire personnalisé en incluant tous les termes souhaités, sous forme de valeurs séparées par des virgules, dans votre demande. L'autre option pour créer votre filtre de vocabulaire consiste à enregistrer vos entrées dans un fichier texte et à les télécharger dans un compartiment Amazon S3, puis à spécifier l'emplacement de votre fichier à l'aide duVocabularyFilterFileUri paramètre.

Notez que si vous l'incluezWords dans votre demande, vous ne pouvez pas utiliserVocabularyFilterFileUri ; vous devez choisir l'un ou l'autre.

Chaque langue possède un jeu de caractères qui contient tous les caractères autorisés pour cette langue spécifique. Si vous utilisez des caractères non pris en charge, votre demande de filtre de vocabulaire personnalisé échoue. Reportez-vous à la section Jeux de caractères pour les vocabulaires personnalisés pour obtenir le jeu de caractères correspondant à votre langue.

Type : tableau de chaînes

Membres du tableau : Nombre minimum de 1 élément.

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 256.

Obligatoire : non

Syntaxe de la réponse

{ "LanguageCode": "string", "LastModifiedTime": number, "VocabularyFilterName": "string" }

Eléments de réponse

Si l'action aboutit, le service renvoie une réponse HTTP 200.

Les données suivantes sont renvoyées au format JSON par le service.

LanguageCode

Le code de langue que vous avez sélectionné pour votre filtre de vocabulaire personnalisé.

Type : String

Valeurs valides : af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

LastModifiedTime

Date et heure auxquelles vous avez créé votre filtre de vocabulaire personnalisé.

Les horodatages sont au formatYYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC. Par exemple,2022-05-04T12:32:58.761000-07:00 représente 12 h 32 UTC-7 le 4 mai 2022.

Type : horodatage

VocabularyFilterName

Le nom que vous avez choisi pour votre filtre de vocabulaire personnalisé.

Type : String

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

Erreurs

Pour plus d'informations sur les erreurs communes à toutes les actions, consultezErreurs courantes.

BadRequestException

Votre demande n'a pas passé un ou plusieurs tests de validation. Cela peut se produire lorsque l'entité que vous essayez de supprimer n'existe pas ou si elle est dans un état non terminal (par exempleIN PROGRESS). Consultez le champ du message d'exception pour plus d'informations.

Code d'état HTTP : 400

ConflictException

Il existe déjà une ressource portant ce nom. Les noms de ressource doivent être uniques dans unCompte AWS.

Code d'état HTTP : 400

InternalFailureException

Une erreur interne s'est produite. Vérifiez le message d'erreur, corrigez le problème et réessayez.

Code d'état HTTP : 500

LimitExceededException

Vous avez envoyé trop de demandes ou votre fichier d'entrée est trop long. Attendez avant de réessayer votre demande, ou utilisez un fichier plus petit et réessayez.

Code d'état HTTP : 400

Voir aussi

Pour plus d'informations sur l'utilisation de cette API dans l'un des kits SDK AWS spécifiques au langage, consultez les ressources suivantes :