Uso de filtros de vocabulario personalizados para eliminar, enmascarar o marcar palabras - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de filtros de vocabulario personalizados para eliminar, enmascarar o marcar palabras

Un filtro de vocabulario personalizado es un archivo de texto que contiene una lista personalizada de palabras individuales que desea modificar en el resultado de la transcripción.

Un caso de uso habitual es la eliminación de términos ofensivos o profanos; sin embargo, los filtros de vocabulario personalizados son completamente personalizados, por lo que puedes seleccionar las palabras que desees. Por ejemplo, si tiene un producto nuevo a punto de lanzarse, puede ocultar el nombre del producto en las transcripciones de las reuniones. En este caso, mantienes a las partes interesadas up-to-date y mantienes el nombre del producto en secreto hasta el lanzamiento.

El filtrado de vocabulario tiene tres métodos de visualización:maskremove, ytag. Consulte los siguientes ejemplos para ver cómo funciona cada uno.

  • Máscara: reemplaza las palabras especificadas por tres asteriscos (***).

    "transcript": "You can specify a list of *** or *** words, and *** *** removes them from transcripts automatically."
  • Eliminar: elimina las palabras especificadas sin dejar nada en su lugar.

    "transcript": "You can specify a list of or words, and removes them from transcripts automatically."
  • Etiqueta: añade una etiqueta ("vocabularyFilterMatch": true) a cada palabra especificada, pero no altera la palabra en sí. El etiquetado permite sustituir y editar transcripciones rápidamente.

    "transcript": "You can specify a list of profane or offensive words, and amazon transcribe removes them from transcripts automatically." ... "alternatives": [ { "confidence": "1.0", "content": "profane" } ], "type": "pronunciation", "vocabularyFilterMatch": true

Al enviar una solicitud de transcripción, puede especificar un filtro de vocabulario personalizado y el método de filtrado que desea aplicar. Amazon Transcribeluego modifica las coincidencias exactas de las palabras cuando aparecen en la transcripción, según el método de filtrado que especifique.

Se pueden aplicar filtros de vocabulario personalizados a las solicitudes de transcripción por lotes y en streaming. Para obtener información acerca de cómo crear un filtro de vocabulario personalizado, consulteCrear un filtro de vocabulario. Para aprender a aplicar el filtro de vocabulario personalizado, consulteUso de un filtro de vocabulario personalizado.

nota

Amazon Transcribeenmascara automáticamente los términos racistas, aunque puede excluirse de este filtro predeterminado poniéndose en contacto con el servicio de SupportAWS técnica.

Para ver un tutorial en vídeo sobre el filtrado de vocabulario, consulte:

Operaciones de API específicas para el filtrado de vocabulario