Vocabularios personalizados - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Vocabularios personalizados

Use vocabularios personalizados para mejorar la precisión de la transcripción de una o más palabras específicas. Por lo general, se trata de términos específicos de un dominio, como nombres de marcas y acrónimos, nombres propios y palabras que Amazon Transcribe no reproduce correctamente.

Los vocabularios personalizados se pueden usar con todos los idiomas admitidos. Tenga en cuenta que sólo los caracteres que figuran en el conjunto de caracteres de su idioma se pueden usar en un vocabulario personalizado.

importante

Usted es responsable de la integridad de sus propios datos cuando utiliza Amazon Transcribe. No introduzca información confidencial, información personal (PII) ni información de salud protegida (PHI) en un vocabulario personalizado.

Consideraciones a la hora de crear un vocabulario personalizado:

  • Puedes tener hasta 100 archivos de vocabulario personalizados por Cuenta de AWS

  • El límite de tamaño de un archivo de vocabulario personalizado es de 50 Kb

  • Si utiliza la API para crear su vocabulario personalizado, su archivo de vocabulario debe estar en formato de texto (*.txt). Si lo utilizas AWS Management Console, tu archivo de vocabulario puede estar en formato de texto (*.txt) o en formato de valores separados por comas (*.csv).

  • Cada entrada de un vocabulario personalizado no puede superar los 256 caracteres

  • Para usar un vocabulario personalizado, debe haber sido creado en la misma Región de AWS forma que tu transcripción.

sugerencia

Puede poner a prueba su vocabulario personalizado utilizando el AWS Management Console. Cuando tu vocabulario personalizado esté listo para usarse, inicia sesión en AWS Management Console, selecciona Transcripción en tiempo real, desplázate hasta Personalizaciones, activa Vocabulario personalizado y selecciona tu vocabulario personalizado en la lista desplegable. Luego seleccione iniciar streaming. Diga algunas de las palabras de su vocabulario personalizado en el micrófono para comprobar si se reproducen correctamente.

Tablas de vocabulario personalizadas en lugar de listas

importante

Los vocabularios personalizados en formato de lista están en desuso. Si va a crear un vocabulario personalizado nuevo, utilice el formato de tabla.

Las tablas ofrecen más opciones y más control sobre la entrada y salida de palabras de su vocabulario personalizado. En el caso de las tablas, debe especificar varias categorías (Phrase and DisplayAs), lo que le permitirá afinar el resultado.

Las listas no tienen opciones adicionales, por lo que sólo puede escribir las entradas tal como desee que aparezcan en la transcripción, sustituyendo todos los espacios por guiones.

Todos los SDK AWS Management Console AWS CLI, y los AWS SDK utilizan tablas de vocabulario personalizadas de la misma manera; las listas se utilizan de forma diferente para cada método y, por lo tanto, es posible que requieran un formato adicional para poder utilizarlas correctamente entre los métodos.

Para obtener más información, consulte Creación de un vocabulario personalizado con una tabla y Crear un vocabulario personalizado mediante una lista.

Para profundizar un poco más y aprender a usar Amazon Augmented AI con vocabularios personalizados, consulte:

Operaciones de API específicas para los vocabularios personalizados