Impact disparate (DI) - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Impact disparate (DI)

La métrique Différence de proportions positives dans les étiquettes prédites peut être évaluée sous la forme d'un rapport.

La métrique Comparaison de proportions positives dans les étiquettes prédites peut être évaluée sous la forme d'un rapport plutôt que d'une différence, comme c'est le cas avec la Différence dans les proportions positives des étiquettes prédites (DPPL). La métrique d'impact disparate (DI) est définie comme le rapport entre la proportion de prédictions positives (y' = 1) pour la facette d et la proportion de prédictions positives (y' = 1) pour la facette a. Par exemple, si le modèle prédit l'octroi de prêts à 60 % d'un groupe d'âge moyen (facette a) et à 50 % d'autres groupes d'âge (facette d), le DI = 0,5/0,6 = 0,8, ce qui indique un biais positif et un impact négatif sur l'autre groupe d'âge représenté par la facette d.

La formule pour le rapport entre les proportions des étiquettes prédites :

        DI = q'd/q'a

Où :

  • q'a = n'a(1)/na est la proportion prédite des membres de la facette a qui obtiennent un résultat positif de valeur 1. Dans notre exemple, la proportion d'une facette d'âge moyen à laquelle l'octroi d'un prêt est prédit. Ici, n'a(1) représente le nombre de membres de la facette a qui obtiennent un résultat positif prédit et na est le nombre de membres de la facette a.

  • q'd = n'd(1)/nd est la proportion prédite des membres de la facette d qui obtiennent un résultat positif de valeur 1. Dans notre exemple, une facette de personnes âgées et plus jeunes à laquelle l'octroi d'un prêt est prédit. Ici, n'd(1) représente le nombre de membres de la facette d qui obtiennent un résultat positif prédit et nd est le nombre de membres de la facette d.

Pour les étiquettes de facettes binaires, multicatégorie et continues, les valeurs DI s'étendent sur l'intervalle [0, ∞).

  • Des valeurs inférieures à 1 indiquent qu'une proportion plus élevée de résultats positifs est prédite à la facette a par rapport à la facette d. D'où l'expression biais positif.

  • Une valeur égale à 1 indique la parité démographique.

  • Des valeurs supérieures à 1 indiquent qu'une proportion plus élevée de résultats positifs est prédite à la facette d par rapport à la facette a. D'où l'expression biais négatif.