違規的結構描述 (constraint_violations.json 檔案) - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

違規的結構描述 (constraint_violations.json 檔案)

MonitoringExecution 的輸出為違規檔案,其中列出針對目前所分析資料集來評估限制條件 (在 constraints.json 檔案中指定) 的結果。Amazon SageMaker 模型監視器預先建置容器提供下列違規檢查。

{ "violations": [{ "feature_name" : "string", "constraint_check_type" : "data_type_check", | "completeness_check", | "baseline_drift_check", | "missing_column_check", | "extra_column_check", | "categorical_values_check" "description" : "string" }] }
監控的違規類型
違規檢查類型 描述
data_type_check

如果目前執行與基準資料集的資料類型不相同,則會標記此違規。

在基準步驟期間,產生的限制條件會針對每個欄,建議推斷的資料類型。您可以調校 monitoring_config.datatype_check_threshold 參數,以調整何時標記為違規的臨界值。

completeness_check

如果在目前執行中觀察到的完整度 (非 null 項目的百分比),超過在每個特徵指定的完整度臨界值中指定的臨界值,則會標記此違規。

在基準步驟期間,產生的限制條件會建議完整度值。

baseline_drift_check

如果目前與基準資料集之間計算的分佈距離大於 monitoring_config.comparison_threshold 中指定的臨界值,則會標記此違規。

missing_column_check

如果目前資料集的欄數少於基準資料集的欄數,則會標記此違規。

extra_column_check

如果目前資料集的欄數超過基準的欄數,則會標記此違規。

categorical_values_check

如果目前資料集的未知值比基準資料集更多,則會標記此違規。此值由 monitoring_config.domain_content_threshold 中的臨界值決定。