CreateVocabulary - Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

CreateVocabulary

Crée un glossaire personnalisé.

Lorsque vous créez un nouveau vocabulaire personnalisé, vous pouvez soit charger un fichier texte contenant vos nouvelles entrées, expressions et termes dans un compartiment Amazon S3, puis inclure l'URI dans votre demande. Vous pouvez également inclure une liste de termes directement dans votre demande à l'aide duPhrases drapeau.

Chaque langue possède un jeu de caractères qui contient tous les caractères autorisés pour cette langue spécifique. Si vous utilisez des caractères non pris en charge, votre demande de vocabulaire personnalisé échoue. Reportez-vous à la section Jeux de caractères pour les vocabulaires personnalisés pour obtenir le jeu de caractères correspondant à votre langue.

Pour de plus amples informations, veuillez consulter Vocabulaires personnalisés.

Syntaxe de la requête

{ "LanguageCode": "string", "Phrases": [ "string" ], "Tags": [ { "Key": "string", "Value": "string" } ], "VocabularyFileUri": "string", "VocabularyName": "string" }

Paramètres de demande

Pour plus d'informations sur les paramètres communs à toutes les actions, voir Paramètres communs.

Cette demande accepte les données suivantes au format JSON.

LanguageCode

Code de langue qui représente la langue des entrées de votre vocabulaire personnalisé. Chaque vocabulaire personnalisé doit contenir des termes dans une seule langue.

Un vocabulaire personnalisé ne peut être utilisé que pour transcrire des fichiers dans la même langue que le vocabulaire personnalisé. Par exemple, si vous créez un vocabulaire personnalisé à l'aide de l'anglais américain (en-US), vous ne pouvez appliquer ce vocabulaire personnalisé qu'aux fichiers contenant du son en anglais.

Pour obtenir la liste des langues prises en charge et leurs codes de langue associés, consultez le tableau des langues prises en charge.

Type : String

Valeurs valides : af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Obligatoire : oui

Phrases

Utilisez ce paramètre si vous souhaitez créer votre vocabulaire personnalisé en incluant tous les termes souhaités, sous forme de valeurs séparées par des virgules, dans votre demande. L'autre option pour créer votre vocabulaire personnalisé consiste à enregistrer vos entrées dans un fichier texte et à les télécharger dans un compartiment Amazon S3, puis à spécifier l'emplacement de votre fichier à l'aide duVocabularyFileUri paramètre.

Notez que si vous l'incluezPhrases dans votre demande, vous ne pouvez pas utiliserVocabularyFileUri ; vous devez choisir l'un ou l'autre.

Chaque langue possède un jeu de caractères qui contient tous les caractères autorisés pour cette langue spécifique. Si vous utilisez des caractères non pris en charge, votre demande de filtre de vocabulaire personnalisé échoue. Reportez-vous à la section Jeux de caractères pour les vocabulaires personnalisés pour obtenir le jeu de caractères correspondant à votre langue.

Type : tableau de chaînes

Contraintes de longueur : Longueur minimum de 0. Longueur maximum de 256.

Modèle : .+

Obligatoire : non

Tags

Ajoute une ou plusieurs balises personnalisées, chacune sous la forme d'une paire clé:valeur, à un nouveau vocabulaire personnalisé au moment où vous créez ce nouveau vocabulaire personnalisé.

Pour en savoir plus sur l'utilisation des balises avec Amazon Transcribe, consultez Ressources sur le balisage.

Type : tableau d’objets Tag

Membres du tableau : Nombre minimum de 1 élément. Nombre maximal de 200 éléments.

Obligatoire : non

VocabularyFileUri

Emplacement Amazon S3 du fichier texte contenant votre glossaire personnalisé. L'URI doit se situer dans le même emplacementRégion AWS que la ressource que vous appelez.

Voici un exemple de chemin d'URI :s3://DOC-EXAMPLE-BUCKET/my-vocab-file.txt

Notez que si vous l'incluezVocabularyFileUri dans votre demande, vous ne pouvez pas utiliser lePhrases drapeau ; vous devez choisir l'un ou l'autre.

Type : String

Contraintes de longueur : Longueur minimum de 1. Longueur maximale de 2000.

Modèle : (s3://|http(s*)://).+

Obligatoire : non

VocabularyName

Un nom unique, choisi par vous, pour votre nouveau vocabulaire personnalisé.

Ce nom distingue les majuscules des minuscules, ne peut pas contenir d'espaces et doit être unique au sein d'unCompte AWS. Si vous essayez de créer un nouveau vocabulaire personnalisé portant le même nom qu'un vocabulaire personnalisé existant, vous obtenez uneConflictException erreur.

Type : String

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

Obligatoire : oui

Syntaxe de la réponse

{ "FailureReason": "string", "LanguageCode": "string", "LastModifiedTime": number, "VocabularyName": "string", "VocabularyState": "string" }

Eléments de réponse

Si l'action aboutit, le service renvoie une réponse HTTP 200.

Les données suivantes sont renvoyées au format JSON par le service.

FailureReason

Si telVocabularyState estFAILED le cas,FailureReason contient des informations sur la raison pour laquelle la demande de vocabulaire personnalisé a échoué. Voir également : Erreurs courantes.

Type : String

LanguageCode

Le code de langue que vous avez sélectionné pour votre vocabulaire personnalisé.

Type : String

Valeurs valides : af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

LastModifiedTime

Date et heure auxquelles vous avez créé votre vocabulaire personnalisé.

Les horodatages sont au formatYYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC. Par exemple,2022-05-04T12:32:58.761000-07:00 représente 12 h 32 UTC-7 le 4 mai 2022.

Type : horodatage

VocabularyName

Le nom que vous avez choisi pour votre vocabulaire personnalisé.

Type : String

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

VocabularyState

État de traitement de votre vocabulaire personnalisé. Si l'état l'estREADY, vous pouvez utiliser le vocabulaire personnalisé dans uneStartTranscriptionJob demande.

Type : String

Valeurs valides : PENDING | READY | FAILED

Erreurs

Pour plus d'informations sur les erreurs communes à toutes les actions, consultezErreurs courantes.

BadRequestException

Votre demande n'a pas passé un ou plusieurs tests de validation. Cela peut se produire lorsque l'entité que vous essayez de supprimer n'existe pas ou si elle est dans un état non terminal (par exempleIN PROGRESS). Consultez le champ du message d'exception pour plus d'informations.

Code d'état HTTP : 400

ConflictException

Il existe déjà une ressource portant ce nom. Les noms de ressource doivent être uniques dans unCompte AWS.

Code d'état HTTP : 400

InternalFailureException

Une erreur interne s'est produite. Vérifiez le message d'erreur, corrigez le problème et réessayez.

Code d'état HTTP : 500

LimitExceededException

Vous avez envoyé trop de demandes ou votre fichier d'entrée est trop long. Patientez avant de réessayer votre demande, ou utilisez un fichier plus petit et réessayez.

Code d'état HTTP : 400

Voir aussi

Pour plus d'informations sur l'utilisation de cette API dans l'un des kits SDK AWS spécifiques au langage, consultez les ressources suivantes :