설명 가능성에 대한 SHAP 기준 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

설명 가능성에 대한 SHAP 기준

설명은 주로 대조적입니다.즉, 대부분 기준으로부터의 편차를 설명합니다. 따라서 동일한 모델 예측의 경우 기준마다 다른 설명이 나올 것으로 예상할 수 있습니다. 따라서 기준을 선택하는 것이 중요합니다. ML 컨텍스트에서 기준은 정보를 제공하지 않거나 정보를 제공할 수 있는 가상의 인스턴스에 해당합니다. Shapley 값을 계산하는 동안 Clarify 는 기준선과 지정된 인스턴스 사이에 몇 개의 새 인스턴스를 생성합니다. 이 경우 기능 값을 기준선의 값으로 설정하여 기능 부재를 모델링하고 기능 값을 지정된 인스턴스의 기능 값으로 설정하여 기능의 존재 여부를 모델링합니다. SageMaker 따라서 모든 특징의 부재는 기준에 해당하고 모든 특징이 존재하는 것은 주어진 인스턴스에 해당합니다.

어떻게 하면 좋은 기준을 선택할 수 있을까요? 정보 내용이 매우 적은 기준을 선택하는 것이 바람직한 경우가 많습니다. 예를 들어, 수치적 특징의 경우 중앙값 또는 평균을 취하고 범주형 특징에 대해서는 모드를 사용하여 훈련 데이터 세트로부터 평균 인스턴스를 구성할 수 있습니다. 대학 입학 예제의 경우, 평균 지원자를 기준으로 한 기준 합격률과 비교하여 특정 지원자가 합격한 이유를 설명하는 데 관심이 있을 수 있습니다. 지정하지 않은 경우 입력 데이터셋의 K-평균 또는 K-프로토타입을 사용하여 Clarify 함수에 의해 SageMaker 베이스라인이 자동으로 계산됩니다.

또는 정보 기준에 대한 설명을 생성하도록 선택할 수 있습니다. 대학 입학 시나리오의 경우 인구통계학적 배경이 비슷한 다른 지원자와 비교했을 때 특정 지원자가 거부된 이유를 설명해야 할 수 있습니다. 이 경우 관심 지원자, 즉 인구통계학적 배경이 비슷한 지원자를 나타내는 기준을 선택할 수 있습니다. 따라서 유익한 기준을 사용하여 특정 모델 예측의 특정 측면에 분석을 집중할 수 있습니다. 인구통계학적 속성 및 조치를 취할 수 없는 기타 특징을 주어진 경우와 동일한 값으로 설정하여 평가 대상 특징을 분리할 수 있습니다.