Lp-norm (LP) - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Lp-norm (LP)

Lp- ノルム (LP) は、トレーニングデータセットの観測ラベルのファセット分布間の p- ノルム距離を測定します。このメトリクスは負ではないため、逆バイアスを検出できません。

Lp- ノルムの計算式は次のとおりです。

        Lp(Pa, Pd) = ( ∑y||Pa - Pd||p)1/p

ここで、点 x と点 y の間の p- ノルム距離は次のように定義されます。

        Lp(x, y) = (|x1-y1|p + |x2-y2|p + … +|xn-yn|p)1/p

2- ノルムはユークリッドノルムです。例えば、大学入試のマルチカテゴリシナリオで、3 つのカテゴリ (yi = {y0, y1, y2} = {合格, 補欠, 不合格}) の結果分布があるとします。ファセット a と d の結果カウントの差の 2 乗の和を求めます。結果のユークリッド距離は次のように計算されます。

        L2(Pa, Pd) = [(na(0) - nd(0))2 + (na(1) - nd(1))2 + (na(2) - nd(2))2]1/2

コードの説明は以下のとおりです。

  • na(i) は、ファセット a の i 番目のカテゴリの結果の数です。例えば、na(0) は、ファセット a の承認の数です。

  • nd(i) は、ファセット d の i 番目のカテゴリの結果の数です。例えば、nd(2) は、ファセット d の拒否の数です。

    バイナリ、マルチカテゴリ、連続結果の LP 値の範囲は、[0, √2) です。

    • ゼロに近い値は、ラベルが同様に分布していることを意味します。

    • 正の値は、ラベル分布の発散を意味し、正の値が大きいほど発散が大きくなります。