コルモゴロフスミルノフ (KS) - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

コルモゴロフスミルノフ (KS)

コルモゴロフスミルノフバイアスメトリクス (KS) は、データセットのファセット a と d の分布におけるラベル間の最大発散に等しくなります。 SageMaker Clarify によって実装された 2 つのサンプル KS テストは、最も不均衡なラベルを見つけることによって、ラベルの不均衡の他の測定を補完します。

コルモゴロフスミルノフメトリクスの計算式は次のとおりです。

        KS = max(|Pa(y) - Pd(y)|)

例えば、大学の志願者グループ (ファセット a) の不合格、補欠、合格がそれぞれ 40%、40%、20% で、他の志願者 (ファセット d) のこの割合が 20%、10%、70% であるとします。この場合、コルモゴロフスミルノフバイアスメトリクス値は次のようになります。

KS = max(|0.4-0.2|, |0.4-0.1|, |0.2-0.7|) = 0.5

これは、ファセット分布間の最大発散が 0.5 であり、合格率で発生します。ラベルは基数 3 のマルチクラスであるため、方程式には 3 つの項があります。

バイナリ、マルチカテゴリ、連続結果の LP 値の範囲は、[0、+1] です。

  • ゼロに近い値は、すべての結果カテゴリのファセット間にラベルが均等に分布していることを示します。例えば、ローンを申請する両方のファセットは、50% の承認と 50% の拒否を取得した場合です。

  • 1 に近い値は、1 つの結果のラベルがすべて 1 つのファセットであることを示します。例えば、ファセット a は 100% の承認を取得し、ファセット d は承認を取得しなかった場合です。

  • 断続的な値は、ラベルの最大不均衡の相対的な程度を示します。