Schéma des violations (fichier constraint_violations.json) - Amazon SageMaker

Schéma des violations (fichier constraint_violations.json)

Le fichier de violations est généré en tant que sortie d'un attribut MonitoringExecution, qui répertorie les résultats de l'évaluation des contraintes (spécifiées dans le fichier constraints.json) par rapport à l'ensemble de données actuel qui a été analysé. Le conteneur intégré Amazon SageMaker Model Monitor fournit les vérifications de violation ci-après.

{ "violations": [{ "feature_name" : "string", "constraint_check_type" : "data_type_check", | "completeness_check", | "baseline_drift_check", | "missing_column_check", | "extra_column_check", | "categorical_values_check" "description" : "string" }] }
Types de violations surveillées
Type de vérification des violations Description
data_type_check

Si les données de l'exécution en cours ne sont pas du même type que celles de l'ensemble de données de référence, cette violation est signalée.

Au cours de l'étape de la référence, les contraintes générées suggèrent le type de données déduit pour chaque colonne. Le paramètre monitoring_config.datatype_check_threshold peut être réglé pour ajuster le seuil lorsqu'il est signalé comme une violation.

completeness_check

Si l'exhaustivité (totalité des éléments non nuls) observée dans l'exécution en cours dépasse le seuil spécifié dans le seuil d'exhaustivité spécifié par fonction, cette violation est signalée.

Au cours de l'étape de référence, les contraintes générées suggèrent une valeur d'exhaustivité.

baseline_drift_check

Si la distance de distribution calculée entre les ensembles de données actif et les ensembles de données de référence est supérieure au seuil spécifié dans monitoring_config.comparison_threshold, cette violation est signalée.

missing_column_check

Si le nombre de colonnes de l'ensemble de données actif est inférieur au nombre de colonnes de l'ensemble de données de référence, cette violation est signalée.

extra_column_check

Si le nombre de colonnes de l'ensemble de données actif est supérieur au nombre de colonnes de la référence, cette violation est signalée.

categorical_values_check

S'il y a plus de valeurs inconnues dans l'ensemble de données actif que dans l'ensemble de données de référence, cette violation est signalée. Cette valeur est dictée par le seuil dans monitoring_config.domain_content_threshold.