Unterschied bei den Ablehnungsraten (DRR) - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Unterschied bei den Ablehnungsraten (DRR)

Die Kennzahl Differenz der Ablehnungsraten (DRR) ist der Unterschied in den Verhältnissen zwischen den wahrhaft negativen (TN) Vorhersagen und den beobachteten negativen Vorhersagen (TN + FN) für die Facetn a und d. Diese Metrik misst den Unterschied in der Genauigkeit des Modells zur Vorhersage von Ablehnungen anhand dieser beiden Facetn. Mit der Genauigkeit wird der Anteil unqualifizierter Kandidaten aus dem Pool unqualifizierter Kandidaten gemessen, die vom Modell als solche identifiziert werden. Wenn die Modellgenauigkeit für die Vorhersage unqualifizierter Bewerber in den einzelnen Facetn unterschiedlich ist, handelt es sich um eine Verzerrung, deren Ausmaß anhand der DRR gemessen wird.

Die Formel für den Unterschied in den Ablehnungsquoten zwischen den Facetn a und d:

        DRR = TNd/(TNd + FNd) – TNa/(TNa + FNa)

Die Komponenten der vorherigen DRR-Gleichung lauten wie folgt.

  • TNd sind die wahren negativen Werte, die für Facet d vorhergesagt wurden.

  • FNd sind die falsch negativen Werte, die für Facet d vorhergesagt wurden.

  • TPa sind die wahren negativen Werte, die für Facet a vorhergesagt wurden.

  • FNa sind die falsch negativen Werte, die für Facet a vorhergesagt wurden.

Nehmen wir zum Beispiel an, das Modell lehnt 100 Antragsteller mittleren Alters (Facet a) für einen Kredit ab (vorhergesagte negative Beschriftungen), von denen 80 tatsächlich nicht qualifiziert sind (beobachtete negative Beschriftungen). Nehmen wir außerdem an, das Modell lehnt 50 Antragsteller aus anderen Bevölkerungsgruppen (Facet d) für einen Kredit ab (prognostizierte negative Bewertungen), von denen nur 40 tatsächlich unqualifiziert sind (beobachtete negative Beschriftungen). Dann ist DRR = 40/50 – 80/100 = 0, sodass keine Verzerrung vorliegt.

Der Wertebereich für DRR für binäre, mehrkategoriale Facetnbeschriftungen und kontinuierliche Beschriftungen ist [-1, +1].

  • Positive Werte liegen vor, wenn das Verhältnis der prognostizierten negativen Ergebnisse (Ablehnungen) zu den beobachteten negativen Ergebnissen (unqualifizierte Bewerber) für Facet d größer ist als das gleiche Verhältnis für Facet a. Diese Werte deuten auf eine mögliche Verzerrung gegenüber der bevorzugten Facet a hin, die durch das Auftreten von relativ mehr falsch negativen Ergebnissen in Facet a verursacht wird. Je größer der Unterschied zwischen den Verhältnissen ist, desto extremer ist die scheinbare Verzerrung.

  • Werte nahe Null liegen vor, wenn das Verhältnis der prognostizierten negativen Ergebnisse (Ablehnungen) zu den beobachteten negativen Ergebnissen (unqualifizierte Bewerber) für die Facetn a und d ähnliche Werte aufweist, was darauf hindeutet, dass die beobachteten Markierungen für negative Ergebnisse vom Modell mit gleicher Genauigkeit vorhergesagt werden.

  • Negative Werte liegen vor, wenn das Verhältnis der prognostizierten negativen Ergebnisse (Ablehnungen) zu den beobachteten negativen Ergebnissen (unqualifizierte Bewerber) für Facet a größer ist als das Verhältnis Facet d. Diese Werte deuten auf eine mögliche Verzerrung gegenüber der ungünstigen Facet d hin, die durch das Auftreten von relativ mehr falsch positiven Ergebnissen in Facet d verursacht wird. Je negativer der Unterschied in den Verhältnissen ist, desto extremer ist die scheinbare Verzerrung.