本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
全域可解釋性
了解功能如何有助於模型的整體輸出,提供有助於選擇功能和模型開發的一般洞見。若要測量新增功能的效果,您通常會使用 和不使用 功能執行交叉驗證。不過,由於運算成本,針對所有功能組合和考量的所有模型類型執行交叉驗證通常是不可行的。因此,其他決定功能重要性的方法對於快速決策很有用。我們建議判斷全域特徵屬性,以彙總所有資料上一節中建議的本機特徵屬性分數。如果時間和運算限制允許,我們也建議在移除功能時計算跨驗證分數的變更。下列範例說明本機屬性分數的彙總。它會平均虹膜分類模型 (從概觀) 的 SHAP 值大小,並將其繪製為熱度圖。您可以看到,在模型中,空格測量在判斷虹膜類別方面沒有扮演重要角色。

對於指定的模型輸出,可以在蜂巢圖中視覺化整個評估執行個體的 SHAP 值集合,如下圖所示 (適用於來自虹膜資料集 【4】 的資料子集)。在這裡,您可以看到 petal_width
屬性對類別 的模型輸出具有最大影響Iris-versicolor
,而高petal_width
值對類別預測有負面影響。當多個資料點具有相同或非常類似的特徵屬性值時,點會堆疊,以指出該位置的盛行率較大。
