일반화 엔트로피(GE) - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

일반화 엔트로피(GE)

일반화 엔트로피 지수(GE)는 관찰된 레이블 대비 예측된 레이블에 대한 편익 불평등 b를 비교하여 측정합니다. False Positive가 예측되면 편익이 발생합니다. False Positive는 음의 관찰치(y=0)가 양의 예측치(y'=1)를 가질 때 발생합니다. 관찰된 레이블과 예측된 레이블이 같을 때도 편익이 발생하며, 이를 True positive 및 True negative라고도 합니다. False Negative가 예측되면 편익이 발생하지 않습니다. 양수 관측치(y=1)가 부정적인 결과(y'=0)를 초래할 것으로 예측될 때 False Negative가 발생합니다. 편익 b는 다음과 같이 정의됩니다.

b = y' - y + 1

이 정의를 사용하면 False Positive는 b의 편익 2를 받고, False Negative는 0의 편익을 받습니다. True positive와 True negative 모두 1의 편익을 받습니다.

GE 지표는 가중치 alpha2로 설정된 일반화 엔트로피 지수(GE)에 따라 계산됩니다. 이 가중치는 다양한 편익 값에 대한 민감도를 제어합니다. alpha가 작을수록 더 작은 값에도 민감도가 높아집니다.

알파 파라미터가 2로 설정된 일반화 엔트로피 지수를 정의하는 방정식.

GE를 계산하는 데 사용되는 다음 변수는 다음과 같이 정의됩니다.

  • biith데이터 포인트가 받는 편익입니다.

  • b'는 모든 편익의 평균입니다.

GE의 범위는 0에서 0.5까지입니다.여기서 값이 0이면 모든 데이터 포인트에서 편익이 불평등하지 않음을 나타냅니다. 이는 모든 입력이 올바르게 예측되거나 모든 예측이 False Positive인 경우에 발생합니다. 모든 예측이 False Negative이면 GE는 정의되지 않습니다.

참고

지표 GE는 패싯 값이 유리한가 불리한가에 달려있지 않습니다.