Unterschied in den Akzeptanzraten (DAR) - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Unterschied in den Akzeptanzraten (DAR)

Die Kennzahl für die Differenz der Akzeptanzraten (DAR) ist die Differenz zwischen den tatsächlichen positiven (TP) Vorhersagen und den beobachteten positiven (TP + FP) für die Facetn a und d. Mit dieser Metrik wird der Unterschied in der Genauigkeit des Modells zur Vorhersage der Akzeptanz anhand dieser beiden Facetn gemessen. Mit der Genauigkeit wird der Anteil qualifizierter Kandidaten aus dem Pool qualifizierter Kandidaten gemessen, die vom Modell als solche identifiziert werden. Wenn die Modellgenauigkeit für die Vorhersage qualifizierter Bewerber in den einzelnen Facetn unterschiedlich ist, handelt es sich um eine Verzerrung, deren Ausmaß mit dem DAR gemessen wird.

Die Formel für den Unterschied in den Akzeptanzquoten zwischen den Facetn a und d:

        DAR = TPa/(TPa + FPa) – TPd/(TPd + FPd)

Wobei gilt:

  • TPa sind die wahren positiven Ergebnisse, die für Facet a vorhergesagt wurden.

  • FPa sind die falsch positiven Ergebnisse, die für Facet a vorhergesagt wurden.

  • TPd sind die wahren positiven Ergebnisse, die für Facet d vorhergesagt wurden.

  • FPd sind die falsch positiven Ergebnisse, die für Facet d vorhergesagt wurden.

Nehmen wir zum Beispiel an, das Modell akzeptiert 70 Antragsteller mittleren Alters (Facet a) für einen Kredit (vorhergesagte positive Beschriftungen), von denen nur 35 tatsächlich akzeptiert werden (beobachtete positive Beschriftungen). Nehmen wir außerdem an, das Modell akzeptiert 100 Antragsteller aus anderen Bevölkerungsgruppen (Facet d) für einen Kredit (prognostizierte positive Beschriftungen), von denen nur 40 tatsächlich akzeptiert werden (beobachtete positive Beschriftungen). Dann ist DAR = 35/70 – 40/100 = 0,10, was auf eine potenzielle Voreingenommenheit gegenüber qualifizierten Personen der zweiten Altersgruppe hindeutet (Facet d).

Der Wertebereich für DAR für binäre, mehrkategoriale Facetnbeschriftungen und fortlaufende Beschriftungen ist [-1, +1].

  • Positive Werte liegen vor, wenn das Verhältnis der prognostizierten positiven Ergebnisse (Zusagen) zu den beobachteten positiven Ergebnissen (qualifizierte Bewerber) für Facet a größer ist als das gleiche Verhältnis für Facet d. Diese Werte deuten auf eine mögliche Verzerrung gegenüber der ungünstigen Facet d hin, die durch das Auftreten von relativ mehr falsch positiven Ergebnissen in Facet d verursacht wird. Je größer der Unterschied zwischen den Verhältnissen ist, desto extremer ist die scheinbare Verzerrung.

  • Werte nahe Null liegen vor, wenn das Verhältnis der prognostizierten positiven Ergebnisse (Akzeptanz) zu den beobachteten positiven Ergebnissen (qualifizierte Bewerber) für die Facetn a und d ähnliche Werte aufweist, was darauf hindeutet, dass die beobachteten Kennzeichnungen für positive Ergebnisse vom Modell mit gleicher Genauigkeit vorhergesagt werden.

  • Negative Werte liegen vor, wenn das Verhältnis der prognostizierten positiven Ergebnisse (Akzeptanz) zu den beobachteten positiven Ergebnissen (qualifizierte Bewerber) für Facet d größer ist als das Verhältnis Facet a. Diese Werte deuten auf eine mögliche Verzerrung gegenüber der bevorzugten Facet a hin, die durch das Auftreten von relativ mehr falsch positiven Ergebnissen in Facet a verursacht wird. Je negativer der Unterschied in den Verhältnissen ist, desto extremer ist die scheinbare Verzerrung.