L_p-norm (LP)

L_p- ノルム (LP) は、トレーニングデータセットの観測ラベルのファセット分布間の p- ノルム距離を測定します。このメトリクスは負ではないため、逆バイアスを検出できません。

L_p- ノルムの計算式は次のとおりです。

L_p(P_a, P_d) = ( ∑_y||P_a - P_d||^p)^1/p

ここで、点 x と点 y の間の p- ノルム距離は次のように定義されます。

L_p(x, y) = (|x₁-y₁|^p + |x₂-y₂|^p + … +|x_n-y_n|^p)^1/p

2- ノルムはユークリッドノルムです。例えば、大学入試のマルチカテゴリシナリオで、3 つのカテゴリ (y_i = {y₀, y₁, y₂} = {合格, 補欠, 不合格}) の結果分布があるとします。ファセット a と d の結果カウントの差の 2 乗の和を求めます。結果のユークリッド距離は次のように計算されます。

L₂(P_a, P_d) = [(n_a⁽⁰⁾ - n_d⁽⁰⁾)² + (n_a⁽¹⁾ - n_d⁽¹⁾)² + (n_a⁽²⁾ - n_d⁽²⁾)²]^1/2

コードの説明は以下のとおりです。

n_a⁽ⁱ⁾ は、ファセット a の i 番目のカテゴリの結果の数です。例えば、n_a⁽⁰⁾ は、ファセット a の承認の数です。
n_d⁽ⁱ⁾ は、ファセット d の i 番目のカテゴリの結果の数です。例えば、n_d⁽²⁾ は、ファセット d の拒否の数です。

バイナリ、マルチカテゴリ、連続結果の LP 値の範囲は、[0, √2) です。
- ゼロに近い値は、ラベルが同様に分布していることを意味します。
- 正の値は、ラベル分布の発散を意味し、正の値が大きいほど発散が大きくなります。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ジェンセンシャノン情報量 (JS)

合計変動距離 (TVD)

Lp-norm (LP)

L_p-norm (LP)