Impact disparate (DI)

Mode de mise au point

Impact disparate (DI) - Amazon SageMaker AI

La métrique Différence de proportions positives dans les étiquettes prédites peut être évaluée sous la forme d'un rapport.

La métrique Comparaison de proportions positives dans les étiquettes prédites peut être évaluée sous la forme d'un rapport plutôt que d'une différence, comme c'est le cas avec la Différence dans les proportions positives des étiquettes prédites (DPPL). La métrique d'impact disparate (DI) est définie comme le rapport entre la proportion de prédictions positives (y' = 1) pour la facette d et la proportion de prédictions positives (y' = 1) pour la facette a. Par exemple, si le modèle prédit l'octroi de prêts à 60 % d'un groupe d'âge moyen (facette a) et à 50 % d'autres groupes d'âge (facette d), le DI = 0,5/0,6 = 0,8, ce qui indique un biais positif et un impact négatif sur l'autre groupe d'âge représenté par la facette d.

La formule pour le rapport entre les proportions des étiquettes prédites :

DI = q'_d/q'_a

Où :

q'_a = n'_a⁽¹⁾/n_a est la proportion prédite des membres de la facette a qui obtiennent un résultat positif de valeur 1. Dans notre exemple, la proportion d'une facette d'âge moyen à laquelle l'octroi d'un prêt est prédit. Ici, n'_a⁽¹⁾ représente le nombre de membres de la facette a qui obtiennent un résultat positif prédit et n_a est le nombre de membres de la facette a.
q'_d = n'_d⁽¹⁾/n_d est la proportion prédite des membres de la facette d qui obtiennent un résultat positif de valeur 1. Dans notre exemple, une facette de personnes âgées et plus jeunes à laquelle l'octroi d'un prêt est prédit. Ici, n'_d⁽¹⁾ représente le nombre de membres de la facette d qui obtiennent un résultat positif prédit et n_d est le nombre de membres de la facette d.

Pour les étiquettes de facettes binaires, multicatégorie et continues, les valeurs DI s'étendent sur l'intervalle [0, ∞).

Des valeurs inférieures à 1 indiquent qu'une proportion plus élevée de résultats positifs est prédite à la facette a par rapport à la facette d. D'où l'expression biais positif.
Une valeur égale à 1 indique la parité démographique.
Des valeurs supérieures à 1 indiquent qu'une proportion plus élevée de résultats positifs est prédite à la facette d par rapport à la facette a. D'où l'expression biais négatif.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.