CreateVocabularyFilter - Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

CreateVocabularyFilter

Crea un filtro de vocabulario personalizado.

Puedes usar filtros de vocabulario personalizados para enmascarar, eliminar o marcar palabras específicas de tu transcripción. Los filtros de vocabulario personalizados se utilizan comúnmente para ocultar blasfemias en las transcripciones.

Cada idioma tiene un conjunto de caracteres que contiene todos los caracteres permitidos para ese idioma específico. Si utilizas caracteres no admitidos, fallará tu solicitud de filtro de vocabulario personalizado. Consulte Conjuntos de caracteres para obtener vocabulario personalizado para obtener el conjunto de caracteres de su idioma.

Para obtener más información, consulte Filtrado de vocabulario.

Sintaxis de la solicitud

{ "LanguageCode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "VocabularyFilterFileUri": "string", "VocabularyFilterName": "string", "Words": [ "string" ] }

Parámetros de solicitud

Para obtener información sobre los parámetros comunes a todas las acciones, consulte Parámetros comunes.

La solicitud acepta los siguientes datos en formato JSON.

LanguageCode

El código de idioma que representa el idioma de las entradas del filtro de vocabulario. Cada filtro de vocabulario personalizado debe contener términos en un solo idioma.

Un filtro de vocabulario personalizado solo se puede utilizar para transcribir archivos en el mismo idioma que el filtro. Por ejemplo, si creas un filtro de vocabulario personalizado con inglés estadounidense (en-US), solo podrás aplicar este filtro a los archivos que contengan audio en inglés.

Para obtener una lista de los idiomas admitidos y sus códigos de idioma asociados, consulte la tabla de idiomas admitidos.

Tipo: cadena

Valores válidos: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Obligatorio: sí

Tags

Añade una o más etiquetas personalizadas, cada una en forma de par clave:valor, a un nuevo filtro de vocabulario personalizado al crear este nuevo filtro de vocabulario.

Para obtener más información sobre cómo usar etiquetas de para usar etiquetas de para usar Amazon Transcribe etiquetas de para usar etiquetas de para usar etiquetas de para usar etiquetas de para usar

Tipo: Matriz de objetos Tag

Miembros de la matriz: número mínimo de 1 elemento. Número máximo de 200 elementos.

Obligatorio: no

VocabularyFilterFileUri

La ubicación en Amazon S3 del archivo de texto que contiene los términos del filtro de vocabulario personalizados. La URI debe encontrarse en laRegión de AWS misma que el recurso al que está llamando.

A continuación se muestra un ejemplo de ruta URI:s3://DOC-EXAMPLE-BUCKET/my-vocab-filter-file.txt

Tenga en cuenta que si lo incluyeVocabularyFilterFileUri en su solicitud, no puede usarloWords; debe elegir uno u otro.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima máxima es de 2000 caracteres.

Patrón: (s3://|http(s*)://).+

Obligatorio: no

VocabularyFilterName

Un nombre único, elegido por ti, para tu nuevo filtro de vocabulario personalizado.

Este nombre distingue entre mayúsculas y minúsculas, no puede contener espacios y debe ser único dentro de unCuenta de AWS. Si intentas crear un nuevo filtro de vocabulario personalizado con el mismo nombre que un filtro de vocabulario personalizado existente,ConflictException aparece un error.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

Obligatorio: sí

Words

Utilice este parámetro si desea crear un filtro de vocabulario personalizado al incluir todos los términos deseados, como valores separados por comas, en su solicitud. La otra opción para crear el filtro de vocabulario consiste en guardar las entradas en un archivo de texto y subirlas a un bucket de Amazon S3 y, a continuación, especificar la ubicación del archivo mediante elVocabularyFilterFileUri parámetro.

Tenga en cuenta que si lo incluyeWords en su solicitud, no puede usarloVocabularyFilterFileUri; debe elegir uno u otro.

Cada idioma tiene un conjunto de caracteres que contiene todos los caracteres permitidos para ese idioma específico. Si utilizas caracteres no admitidos, fallará tu solicitud de filtro de vocabulario personalizado. Consulte Conjuntos de caracteres para obtener vocabulario personalizado para obtener el conjunto de caracteres de su idioma.

Tipo: matriz de cadenas

Miembros de la matriz: número mínimo de 1 elemento.

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 256 caracteres.

Obligatorio: no

Sintaxis de la respuesta

{ "LanguageCode": "string", "LastModifiedTime": number, "VocabularyFilterName": "string" }

Elementos de respuesta

Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.

El servicio devuelve los datos siguientes en formato JSON.

LanguageCode

El código de idioma que seleccionaste para tu filtro de vocabulario personalizado.

Tipo: cadena

Valores válidos: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

LastModifiedTime

La fecha y la hora en que creaste tu filtro de vocabulario personalizado.

Las marcas de tiempo están en el formatoYYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC. Por ejemplo,2022-05-04T12:32:58.761000-07:00 representa a las 12:32 p. m., hora peninsular española, del 4 de mayo de 2022.

Tipo: marca temporal

VocabularyFilterName

El nombre que elegiste para tu filtro de vocabulario personalizado.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

Errores

Para obtener información sobre los errores comunes a todas las acciones, consulteErrores comunes.

BadRequestException

Tu solicitud no ha superado una o más pruebas de validación. Esto puede ocurrir cuando la entidad que intentas eliminar no existe o si se encuentra en un estado no terminal (por ejemploIN PROGRESS). Para obtener más información, consulte el campo mensaje de excepción.

Código de estado HTTP: 400

ConflictException

Ya existe un recurso con este nombre. Los nombres de recursos deben ser únicos dentro deCuenta de AWS.

Código de estado HTTP: 400

InternalFailureException

Se produjo un error interno. Compruebe el mensaje de error, corrija el problema e intente realizar la solicitud de nuevo.

Código de estado HTTP: 500

LimitExceededException

Has enviado demasiadas solicitudes o tu archivo de entrada es demasiado largo. Espere antes de volver a intentar la solicitud o utilice un archivo más pequeño y vuelva a intentarlo.

Código de estado HTTP: 400

Véase también

Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: