Diferencia en tasas de aceptación (DAR)

La métrica de diferencia en tasas de aceptación (DAR) es la diferencia en las relaciones entre las predicciones positivas verdaderas (TP) y las positivas observadas (TP + FP) para las facetas a y d. Esta métrica mide la diferencia en la precisión del modelo para predecir las aceptaciones de estas dos facetas. La precisión mide la fracción de candidatos cualificados del grupo de candidatos cualificados que el modelo identifica como tales. Si la precisión del modelo para predecir los candidatos cualificados difiere de una faceta a otra, se trata de un sesgo y la DAR mide su magnitud.

La fórmula para la diferencia en tasas de aceptación entre las facetas a y d es la siguiente:

DAR = TP_a/(TP_a + FP_a) - TP_d/(TP_d + FP_d)

Donde:

TP_a son los verdaderos positivos predichos para la faceta a.
FP_a son los falsos positivos predichos para la faceta a.
TP_d son los verdaderos positivos predichos para la faceta d.
FP_d son los falsos positivos predichos para la faceta d.

Por ejemplo, suponga que el modelo acepta 70 candidatos de mediana edad (faceta a) para un préstamo (etiquetas predichas positivas), de los cuales solo se aceptan 35 (etiquetas observadas positivas). Suponga también que el modelo acepta 100 candidatos de otros grupos demográficos (faceta d) para un préstamo (etiquetas predichas positivas), de los cuales solo se aceptan 40 (etiquetas observadas positivas). Entonces, DAR = 35/70 - 40/100 = 0,10, lo que indica un posible sesgo en contra de las personas cualificadas del segundo grupo de edad (faceta d).

El rango de valores DAR para etiquetas de facetas multicategoría, binarias y continuas es [-1, +1].

Los valores positivos se producen cuando la relación entre los resultados positivos predichos (aceptaciones) y los resultados positivos observados (candidatos cualificados) para la faceta a es mayor que la misma relación para la faceta d. Estos valores indican un posible sesgo en contra de la faceta desfavorecida d debido a la ocurrencia de un número relativamente mayor de falsos positivos en la faceta d. Cuanto mayor sea la diferencia de las relaciones, más extremo será el sesgo aparente.
Los valores cercanos a cero se producen cuando la relación entre los resultados positivos predichos (aceptaciones) y los resultados positivos observados (candidatos cualificados) en las facetas a y d tiene valores similares, lo que indica que las etiquetas observadas de resultados positivos están siendo predichas con la misma precisión por el modelo.
Los valores negativos se producen cuando la relación entre los resultados positivos predichos (aceptaciones) y los resultados positivos observados (candidatos cualificados) para la faceta d es mayor que la misma relación para la faceta a. Estos valores indican un posible sesgo en contra de la faceta favorecida a provocado por la ocurrencia de un número relativamente mayor de falsos positivos en la faceta a. Cuanto más negativa sea la diferencia de las relaciones, más extremo será el sesgo aparente.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Diferencia de coincidencias (RD)

Diferencia en tasas de rechazo (DRR)