承認率の差 (DAR)

承認率の差 (DAR) メトリクスは、ファセット a および d の観測された陽性 (TP + FP) に対する真陽性 (TP) 予測の比率の差です。このメトリクスは、これらの 2 つのファセットからの承認を予測するためのモデルの精度の差を測定します。精度は、対象となる候補のプールから、モデルによってそのように識別された対象となる候補の割合を測定します。対象となる申請者を予測するためのモデルの精度がファセット間で異なる場合、これはバイアスであり、その大きさは DAR によって測定されます。

ファセット a および d の承認率の差の計算式は次のとおりです。

DAR = TP_a/(TP_a + FP_a) - TP_d/(TP_d + FP_d)

コードの説明は以下のとおりです。

TP_a は、ファセット a に対して予測される真陽性です。
FP_a は、ファセット a に対して予測される偽陽性です。
TP_d は、ファセット d に対して予測される真陽性です。
FP_d は、ファセット d に対して予測される偽陽性です。

例えば、モデルが 70 人の中高年層の申請者 (ファセット a) のローンを承認し (正の予測ラベル)、そのうち 35 人だけが実際に承認されたとします (正の観測ラベル)。また、モデルが他の年齢層 (ファセット d) から 100 人の申請者のローンを承認し (正の予測ラベル)、そのうち 40 人だけが実際に承認されたとします (正の観測ラベル)。そうすると、DAR = 35/70 - 40/100 = 0.10 となり、これは、2 番目の年齢層 (ファセット d) からの対象となる人たちに対する潜在的なバイアスを示しています。

バイナリ、マルチカテゴリファセット、連続ラベルの DAR の値の範囲は、[-1, +1] です。

正の値は、ファセット a の予測された正の結果 (承認) と観測された正の結果 (対象となる申請者) の比率が、ファセット d の同様の比率よりも大きい場合に発生します。これらの値は、ファセット d で比較的多くの偽陽性が発生することによって引き起こされる不利なファセット d に対するバイアスの可能性を示します。比率の差が大きいほど、見かけ上のバイアスは大きくなります。
ゼロに近い値は、ファセット a と d の予測された正の結果 (承認) と観測された正の結果 (対象となる申請者) の比率が類似した値を持ち、正の結果の観察ラベルがモデルによって同じ精度で予測されていることを示す場合に発生します。
負の値は、ファセット d の予測された正の結果 (承認) と観測された正の結果 (対象となる申請者) の比率が、ファセット a の比率よりも大きい場合に発生します。これらの値は、ファセット a で比較的多くの偽陽性が発生することによって引き起こされる有利なファセット a に対するバイアスの可能性を示します。比率の差が負であるほど、見かけ上のバイアスは大きくなります。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

リコール差 (RD)

拒否率の差 (DRR)