Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Crear un vocabulario personalizado mediante una lista
importante
Los vocabularios personalizados en formato de lista están en desuso, por lo que si vas a crear un nuevo vocabulario personalizado, te recomendamos encarecidamente que utilices el formato de tabla.
Puede crear vocabularios personalizados a partir de listas mediante los SDK AWS Management ConsoleAWS CLI, o los AWS SDK.
-
AWS Management Console: Debes crear y subir un archivo de texto que contenga tu vocabulario personalizado. Puede utilizar entradas separadas por líneas o por comas. Tenga en cuenta que la lista debe guardarse como un archivo de texto (*.txt) en
LF
formato. Si utiliza cualquier otro formato, por ejemploCRLF
, su vocabulario personalizado no será aceptado porAmazon Transcribe. -
AWS CLIy AWSSDK: debes incluir tu vocabulario personalizado como entradas separadas por comas en tu llamada a la API mediante el indicador.
Phrases
Si una entrada contiene varias palabras, debe separar cada palabra con guiones. Por ejemplo, incluyes «Los Ángeles» como Los-Angeles
y «Andorra la Vieja» como. Andorra-la-Vella
A continuación se muestran ejemplos de los dos formatos de lista válidos. Consulte Creación de listas de vocabulario personalizadas para ver ejemplos de métodos específicos.
-
Entradas separadas por comas:
Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
-
Entradas separadas por líneas:
Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
importante
Solo puedes usar caracteres compatibles con tu idioma. Consulte el conjunto de caracteres de su idioma para obtener más información.
La CreateMedicalVocabulary
operación no admite listas de vocabulario personalizadas. Si va a crear un vocabulario médico personalizado, debe utilizar un formato de tabla; consulte las Creación de un vocabulario personalizado con una tabla instrucciones.
Creación de listas de vocabulario personalizadas
Para procesar una lista de vocabulario personalizada para usarla con Amazon Transcribe ella, consulte los siguientes ejemplos:
En este ejemplo se utiliza el comando create-vocabulary con un archivo de vocabulario personalizado con formato de lista. Para obtener más información, consulte CreateVocabulary
.
aws transcribe create-vocabulary \ --vocabulary-name
my-first-vocabulary
\ --language-codeen-US
\ --phrases {CLI,Eva-Maria,ABCs
}
Este es otro ejemplo en el que se usa el comando create-vocabulary y un cuerpo de solicitud que crea tu vocabulario personalizado.
aws transcribe create-vocabulary \ --cli-input-json file://
filepath
/my-first-vocab-list
.json
El archivo my-first-vocab-list.json contiene el siguiente cuerpo de solicitud.
{ "VocabularyName": "
my-first-vocabulary
", "LanguageCode": "en-US
", "Phrases": [ "CLI
","Eva-Maria
","ABCs
" ] }
Una vez que VocabularyState
cambies de PENDING
aREADY
, tu vocabulario personalizado estará listo para usarse con una transcripción. Para consultar el estado actual de su vocabulario personalizado, ejecute:
aws transcribe get-vocabulary \ --vocabulary-name
my-first-vocabulary
En este ejemplo se utiliza el AWS SDK for Python (Boto3) para crear un vocabulario personalizado a partir de una lista mediante el método create_vocabularyCreateVocabulary
.
Para ver más ejemplos de uso de AWS los SDK, incluidos ejemplos de funciones específicas, escenarios y multiservicios, consulte el capítulo. Ejemplos de código para Amazon Transcribe usando AWS SDKs
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') vocab_name = "my-first-vocabulary
" response = transcribe.create_vocabulary( LanguageCode = 'en-US
', VocabularyName = vocab_name, Phrases = [ 'CLI
','Eva-Maria
','ABCs
' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
nota
Si creas un nuevo Amazon S3 depósito para tus archivos de vocabulario personalizados, asegúrate de que el IAM rol que realiza la CreateVocabulary
solicitud tenga permisos para acceder a este depósito. Si el rol no tiene los permisos correctos, se producirá un error en la solicitud. Si lo desea, puede especificar un IAM rol en su solicitud mediante la inclusión del DataAccessRoleArn
parámetro. Para obtener más información sobre las IAM funciones y las políticas enAmazon Transcribe, consulteAmazon Transcribe ejemplos de políticas basadas en la identidad.