在分析中使用進階指標 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在分析中使用進階指標

以下部分說明如何在 Amazon SageMaker Canvas 中尋找和解譯模型的進階指標。

注意

進階量度目前僅適用於數值和分類預測模型。

若要尋找「進階測量結果」標籤,請執行下列動作:

  1. 開啟 SageMaker 畫布應用程式。

  2. 在左側導覽窗格中選擇 My Models (我的模型)。

  3. 選擇您建立的模型。

  4. 在頂部導覽窗格中,選擇 Analyze (分析) 索引標籤。

  5. 在「分析」索引標籤中,選擇「進階量度」標籤。

在「高級度量」選項卡中,您可以找到「性能」選項卡。該頁面看起來像下面的屏幕截圖。


                分類預測模型的進階量度索引標籤螢幕擷取畫面。

在頂端,您可以查看量度分數的概觀,包括「最佳化」量度,這是您在建置模型時選取的量度 (或預設選取的「畫布」)。

下列段落說明「進階」測量結果中「效能」頁籤的詳細資訊。

效能

在「效能」標籤中,您會看到「度量」表格,以及 Canvas 根據您的模型類型建立的視覺效果。對於分類預測模型,Canvas 提供了一個混淆矩陣,而對於數字預測模型,Canvas 為您提供殘差錯誤密度圖表。

在「量度」表格中,系統會為您提供模型每個進階量度的分數完整清單,這比頁面頂端的分數概覽更為全面。此處顯示的指標取決於您的模型類型。如需協助您瞭解和解譯每個量度的參考資料,請參閱指標參考

若要瞭解根據模型類型可能顯示的視覺效果,請參閱下列選項:

  • 混淆矩陣 — Canvas 使用混淆矩陣來幫助您在模型正確進行預測時進行可視化。在混淆矩陣中,您的結果會被加以排列,以比較預測值與實際值。下列範例解釋混淆矩陣如何在預測正面和負面標籤的 2 類別預測模型中運作:

    • 相符 - 當真標籤為正數時,模型正確地預測正值。

    • 不相符 — 當真標籤為負值時,模型正確地預測負值。

    • 誤報 - 當真標籤為負值時,模型錯誤地預測正數。

    • 漏報 - 當真標籤為正數時,模型錯誤地預測負值。

  • 精確召回曲線 — 精確召回曲線是根據模型召回分數繪製的模型精確度分數的視覺化效果。通常,可以進行完美預測的模型將具有精確度並召回兩者都是 1 的分數。對於體面準確的模型,精度調用曲線在精度和召回方面都會相當高。

  • 差-殘差是實際值和由模型預測的值之間的差異。殘差圖繪製對相應值的殘餘值,以可視化它們的分佈和任何模式或離群值。零左右殘餘的正態分佈表示模型非常適合資料。但是,如果剩餘值明顯偏斜或具有異常值,則可能表示模型正在過度擬合數據,或者還有其他需要解決的問題。

  • 錯誤密度 — 錯誤密度繪圖是模型所產生錯誤分佈的表示法。它會顯示每個點上錯誤的概率密度,協助您識別模型可能過度擬合或產生系統錯誤的任何區域。