Vocabulaires personnalisés - Amazon Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vocabulaires personnalisés

Utilisez des vocabulaires personnalisés pour améliorer la précision de la transcription d’un ou de plusieurs mots spécifiques. Il s’agit généralement de termes spécifiques à un domaine, tels que des noms de marque et des acronymes, des noms propres et des mots qu’ Amazon Transcribe ne rend pas correctement.

Les vocabulaires personnalisés peuvent être utilisés avec toutes les langues prises en charge. Notez que seuls les caractères répertoriés dans le jeu de caractères de votre langue peuvent être utilisés dans un vocabulaire personnalisé.

Important

Vous êtes responsable de l’intégrité de vos propres données lorsque vous les utilisez Amazon Transcribe. N’entrez pas d’informations confidentielles, personnelles (PII) ou protégées sur la santé (PHI) dans un vocabulaire personnalisé.

Considérations à prendre en compte lors de la création d’un vocabulaire personnalisé :

  • Vous pouvez avoir jusqu'à 100 fichiers de vocabulaire personnalisés par Compte AWS

  • La taille de chaque vocabulaire personnalisé est limitée à 50 Ko.

  • Si vous utilisez l’API pour créer votre vocabulaire personnalisé, votre fichier de vocabulaire doit être au format texte (*.txt). Si vous utilisez le AWS Management Console, votre fichier de vocabulaire peut être au format texte (*.txt) ou au format valeur séparée par des virgules (*.csv).

  • Chaque entrée d’un vocabulaire personnalisé ne peut pas dépasser 256 caractères.

  • Pour utiliser un vocabulaire personnalisé, celui-ci doit avoir été créé en même temps Région AWS que votre transcription.

Astuce

Vous pouvez tester votre vocabulaire personnalisé à l'aide du AWS Management Console. Une fois que votre vocabulaire personnalisé est prêt à être utilisé, connectez-vous au AWS Management Console, sélectionnez Transcription en temps réel, faites défiler l'écran jusqu'à Personnalisations, activez Vocabulaire personnalisé et sélectionnez votre vocabulaire personnalisé dans la liste déroulante. Sélectionnez ensuite Démarrer le streaming. Prononcez quelques mots de votre vocabulaire personnalisé dans votre micro pour vérifier s’ils s’affichent correctement.

Tableaux de vocabulaires personnalisés et listes de vocabulaires personnalisés

Important

Les vocabulaires personnalisés sous forme de liste sont obsolètes. Si vous créez un nouveau vocabulaire personnalisé, utilisez le format de tableau.

Les tableaux vous offrent davantage d’options et de contrôle sur l’entrée et la sortie des mots de votre vocabulaire personnalisé. Avec les tableaux, vous devez définir plusieurs catégories (Phrase and DisplayAs), ce qui vous permet d’affiner vos résultats.

Les listes ne comportent pas d’options supplémentaires. Vous pouvez donc uniquement saisir les entrées telles que vous souhaitez qu’elles apparaissent dans votre transcription, en remplaçant tous les espaces par des tirets.

Les AWS SDK et AWS Management Console AWS CLI, utilisent tous des tables de vocabulaire personnalisées de la même manière ; les listes sont utilisées différemment pour chaque méthode et peuvent donc nécessiter un formatage supplémentaire pour une utilisation réussie entre les méthodes.

Pour plus d’informations, consultez Création d’un vocabulaire personnalisé à l’aide d’un tableau et Création d'un vocabulaire personnalisé à l'aide d'une liste.

Pour aller un peu plus loin et apprendre à utiliser Amazon Augmented AI avec des vocabulaires personnalisés, consultez :

Opérations d’API spécifiques aux vocabulaires personnalisés