Bloqueo de palabras y conversaciones dañinas con filtros de contenido
Barreras de protección para Amazon Bedrock admite filtros de contenido para ayudar a detectar y filtrar las entradas dañinas de los usuarios y las salidas generadas por el modelo. Los filtros de contenido se admiten en las categorías siguientes:
Odio
Describe las peticiones de entrada y las respuestas del modelo que discriminan, critican, insultan, denuncian o deshumanizan a una persona o grupo sobre la base de su identidad, ya sea de raza, etnia, género, religión, orientación sexual, capacidad y origen nacional.
Insultos
Describe las peticiones de entrada y las respuestas del modelo que incluyen lenguaje degradante, humillante, burlón, insultante o denigrante. Este tipo de lenguaje también se denomina intimidación.
Sexual
Describe las peticiones de entrada y las respuestas del modelo que denotan interés, actividad o excitación sexual mediante referencias directas o indirectas a partes del cuerpo, a rasgos físicos o al sexo.
Violencia
Describe las peticiones de entrada y las respuestas del modelo, que incluyen la glorificación o las amenazas de infligir dolor físico, dañar o lesionar a una persona, grupo o cosa.
Mala conducta
Describe las peticiones de entrada y las respuestas del modelo que buscan o proporcionan información sobre la participación en una actividad delictiva o sobre cómo dañar, defraudar o aprovecharse de una persona, grupo o institución.
Configuración de filtros de contenido para su barrera de protección
Puede configurar filtros de contenido para su barrera de protección mediante la Consola de administración de AWS o la API de Amazon Bedrock.