Disparidad demográfica condicional en las etiquetas predichas (CDDPL)

La métrica de disparidad demográfica (DDPL) determina si la faceta d tiene una proporción mayor de etiquetas rechazadas predichas que de etiquetas aceptadas predichas. Permite comparar la diferencia entre la proporción de rechazo predicha y la proporción de aceptación predicha en todas las facetas. Esta métrica es exactamente la misma que la métrica CDD previa al entrenamiento, excepto que se calcula a partir de las etiquetas predichas en lugar de las observadas. Esta métrica se encuentra en el rango (-1,+1).

La fórmula para las predicciones de disparidad demográfica para las etiquetas de la faceta d es la siguiente:

DDPL_d = n'_d⁽⁰⁾/n'⁽⁰⁾ - n'_d⁽¹⁾/n'⁽¹⁾ = P_d^R(y'⁰) - P_d^A(y'¹)

Donde:

n'⁽⁰⁾ = n'_a⁽⁰⁾+ n'_d⁽⁰⁾ es el número de etiquetas rechazadas predichas para las facetas a y d.
n'⁽¹⁾ = n'_a⁽¹⁾+ n'_d⁽¹⁾ es el número de etiquetas aceptadas predichas para las facetas a y d.
P_d^R(y'⁰) es la proporción de etiquetas rechazadas predichas (valor 0) en la faceta d.
P_d^A(y'¹) es la proporción de etiquetas aceptadas predichas (valor 1) en la faceta d.

Para descartar la paradoja de Simpson, se requiere una métrica (CDDPL) de etiquetas predichas que condicione la DDPL a los atributos que definen un estrato de subgrupos del conjunto de datos. La reagrupación puede proporcionar información sobre la causa de las aparentes disparidades demográficas en las facetas menos favorecidas. El caso clásico surgió en el caso de las admisiones en Berkeley, donde en general los hombres eran aceptados a una tasa más alta que las mujeres. Sin embargo, cuando se examinaron los subgrupos departamentales, se comprobó que las mujeres tenían tasas de admisión más altas que los hombres por departamento. La explicación es que las mujeres se habían presentado a departamentos con tasas de aceptación más bajas que las de los hombres. El examen de las tasas de aceptación del subgrupo reveló que, de hecho, las mujeres eran aceptadas en mayor medida que los hombres en los departamentos con tasas de aceptación más bajas.

La métrica CDDPL proporciona una medida única para todas las disparidades detectadas en los subgrupos definidos por un atributo de un conjunto de datos al promediarlas. Se define como el promedio ponderado de las disparidades demográficas en las etiquetas predichas (DDPL_i) para cada uno de los subgrupos, y la disparidad de cada subgrupo se pondera en proporción al número de observaciones que contiene. La fórmula de la disparidad demográfica condicional en las etiquetas predichas es la siguiente:

CDDPL = (1/n)_*∑_in_i _*DDPL_i

Donde:

∑_in_i = n es el número total de observaciones y n _i es el número de observaciones de cada subgrupo.
DDPL_i = n'_i⁽⁰⁾/n⁽⁰⁾ - n'_i⁽¹⁾/n⁽¹⁾ = P_i^R(y'⁰) - P_i^A(y'¹) es la disparidad demográfica en las etiquetas predichas para el subgrupo.

La disparidad demográfica de un subgrupo en las etiquetas predichas (DDPL_i) es la diferencia entre la proporción de etiquetas predichas rechazadas y la proporción de etiquetas predichas aceptadas en cada subgrupo.

El rango de valores DDLP para los resultados binarios, multicategoría y continuos es [-1,+1].

+1: cuando no hay etiquetas de rechazo predichas para la faceta a o el subgrupo ni aceptaciones predichas para la faceta d o el subgrupo.
Los valores positivos indican que hay una disparidad demográfica en las etiquetas predichas, ya que la faceta d o el subgrupo tiene una proporción mayor de etiquetas predichas rechazadas que de etiquetas predichas aceptadas. Cuanto mayor sea el valor, mayor será la disparidad.
Los valores cercanos a cero indican que, en promedio, no hay disparidad demográfica.
Los valores negativos indican que hay una disparidad demográfica en las etiquetas predichas, ya que la faceta a o el subgrupo tiene una proporción mayor de etiquetas predichas rechazadas que de etiquetas predichas aceptadas. Cuanto menor sea el valor, mayor será la disparidad.
-1: cuando no hay etiquetas de rechazo predichas para la faceta d o el subgrupo ni aceptaciones predichas para la faceta a o el subgrupo.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Igualdad de tratamiento (TE)

Prueba de contrafácticos (FT)