广义熵 (GE) - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

广义熵 (GE)

广义熵指数 (GE) 衡量预测标签与观测标签相比在权益 b 上的不平等程度。当预测到假阳性结果时,就会获得权益。当阴性观测值 (y=0) 的预测结果为阳性 (y'=1) 时,就会出现假阳性。当观测标签和预测标签相同(也称为真阳性和真阴性)时,也会获得权益。当预测到假阴性时,不会获得任何权益。当预测到阳性观测值 (y=1) 的结果为阴性 (y'=0) 时,就会出现假阴性。权益 b 定义如下。

b = y' - y + 1

根据此定义,假阳性获得值为 2 的权益 b,而假阴性获得值为 0 的权益。真阳性和真阴性都将获得值为 1 的权益。

GE 指标按照广义熵指数 (GE) 计算,权重 alpha 设置为 2。此权重控制对不同权益值的敏感度。alpha 越小,对较小值的敏感度就越高。

定义广义熵指数的等式,alpha 参数设置为 2。

用于计算 GE 的变量定义如下:

  • biith 数据点获得的权益。

  • b' 是所有权益的平均值。

GE 的范围为 0 到 0.5,值为零表示所有数据点的权益没有不平等现象。当所有输入都正确预测时,或者当所有预测均为假阳性时,就会发生这种情况。当所有预测均为假阴性时,GE 的定义不明确。

注意

GE 指标并不取决于某个分面值是有利还是不利。