Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Disparidad demográfica condicional en las etiquetas predichas (CDDPL)

Modo de enfoque
Disparidad demográfica condicional en las etiquetas predichas (CDDPL) - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

La métrica de disparidad demográfica (DDPL) determina si la faceta d tiene una proporción mayor de etiquetas rechazadas predichas que de etiquetas aceptadas predichas. Permite comparar la diferencia entre la proporción de rechazo predicha y la proporción de aceptación predicha en todas las facetas. Esta métrica es exactamente la misma que la métrica CDD previa al entrenamiento, excepto que se calcula a partir de las etiquetas predichas en lugar de las observadas. Esta métrica se encuentra en el rango (-1,+1).

La fórmula para las predicciones de disparidad demográfica para las etiquetas de la faceta d es la siguiente:

        DDPLd = n'd(0)/n'(0) - n'd(1)/n'(1) = PdR(y'0) - PdA(y'1)

Donde:

  • n'(0) = n'a(0) + n'd(0) es el número de etiquetas rechazadas predichas para las facetas a y d.

  • n'(1) = n'a(1) + n'd(1) es el número de etiquetas aceptadas predichas para las facetas a y d.

  • PdR(y'0) es la proporción de etiquetas rechazadas predichas (valor 0) en la faceta d.

  • PdA(y'1) es la proporción de etiquetas aceptadas predichas (valor 1) en la faceta d.

Para descartar la paradoja de Simpson, se requiere una métrica (CDDPL) de etiquetas predichas que condicione la DDPL a los atributos que definen un estrato de subgrupos del conjunto de datos. La reagrupación puede proporcionar información sobre la causa de las aparentes disparidades demográficas en las facetas menos favorecidas. El caso clásico surgió en el caso de las admisiones en Berkeley, donde en general los hombres eran aceptados a una tasa más alta que las mujeres. Sin embargo, cuando se examinaron los subgrupos departamentales, se comprobó que las mujeres tenían tasas de admisión más altas que los hombres por departamento. La explicación es que las mujeres se habían presentado a departamentos con tasas de aceptación más bajas que las de los hombres. El examen de las tasas de aceptación del subgrupo reveló que, de hecho, las mujeres eran aceptadas en mayor medida que los hombres en los departamentos con tasas de aceptación más bajas.

La métrica CDDPL proporciona una medida única para todas las disparidades detectadas en los subgrupos definidos por un atributo de un conjunto de datos al promediarlas. Se define como el promedio ponderado de las disparidades demográficas en las etiquetas predichas (DDPLi) para cada uno de los subgrupos, y la disparidad de cada subgrupo se pondera en proporción al número de observaciones que contiene. La fórmula de la disparidad demográfica condicional en las etiquetas predichas es la siguiente:

        CDDPL = (1/n)*ini *DDPLi

Donde:

  • ini = n es el número total de observaciones y n i es el número de observaciones de cada subgrupo.

  • DDPLi = n'i(0)/n(0) - n'i(1)/n(1) = PiR(y'0) - PiA(y'1) es la disparidad demográfica en las etiquetas predichas para el subgrupo.

La disparidad demográfica de un subgrupo en las etiquetas predichas (DDPLi) es la diferencia entre la proporción de etiquetas predichas rechazadas y la proporción de etiquetas predichas aceptadas en cada subgrupo.

El rango de valores DDLP para los resultados binarios, multicategoría y continuos es [-1,+1].

  • +1: cuando no hay etiquetas de rechazo predichas para la faceta a o el subgrupo ni aceptaciones predichas para la faceta d o el subgrupo.

  • Los valores positivos indican que hay una disparidad demográfica en las etiquetas predichas, ya que la faceta d o el subgrupo tiene una proporción mayor de etiquetas predichas rechazadas que de etiquetas predichas aceptadas. Cuanto mayor sea el valor, mayor será la disparidad.

  • Los valores cercanos a cero indican que, en promedio, no hay disparidad demográfica.

  • Los valores negativos indican que hay una disparidad demográfica en las etiquetas predichas, ya que la faceta a o el subgrupo tiene una proporción mayor de etiquetas predichas rechazadas que de etiquetas predichas aceptadas. Cuanto menor sea el valor, mayor será la disparidad.

  • -1: cuando no hay etiquetas de rechazo predichas para la faceta d o el subgrupo ni aceptaciones predichas para la faceta a o el subgrupo.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.