Schéma des violations (fichier constraint_violations.json) - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Schéma des violations (fichier constraint_violations.json)

Le fichier de violations est généré en tant que sortie d'un attribut MonitoringExecution, qui répertorie les résultats de l'évaluation des contraintes (spécifiées dans le fichier constraints.json) par rapport au jeu de données actuel qui a été analysé. Le conteneur SageMaker prédéfini Amazon Model Monitor fournit les contrôles de violation suivants.

{ "violations": [{ "feature_name" : "string", "constraint_check_type" : "data_type_check", | "completeness_check", | "baseline_drift_check", | "missing_column_check", | "extra_column_check", | "categorical_values_check" "description" : "string" }] }
Types de violations surveillées
Type de vérification des violations Description
data_type_check

Si les données de l'exécution en cours ne sont pas du même type que celles du jeu de données de référence, cette violation est signalée.

Au cours de l'étape de la référence, les contraintes générées suggèrent le type de données déduit pour chaque colonne. Le paramètre monitoring_config.datatype_check_threshold peut être réglé pour ajuster le seuil lorsqu'il est signalé comme une violation.

completeness_check

Si l'exhaustivité (totalité des éléments non nuls) observée dans l'exécution en cours dépasse le seuil spécifié dans le seuil d'exhaustivité spécifié par fonction, cette violation est signalée.

Au cours de l'étape de référence, les contraintes générées suggèrent une valeur d'exhaustivité.

baseline_drift_check

Si la distance de distribution calculée entre les jeux de données actif et les ensembles de données de référence est supérieure au seuil spécifié dans monitoring_config.comparison_threshold, cette violation est signalée.

missing_column_check

Si le nombre de colonnes du jeu de données actif est inférieur au nombre de colonnes du jeu de données de référence, cette violation est signalée.

extra_column_check

Si le nombre de colonnes du jeu de données actif est supérieur au nombre de colonnes de la référence, cette violation est signalée.

categorical_values_check

S'il y a plus de valeurs inconnues dans le jeu de données actif que dans le jeu de données de référence, cette violation est signalée. Cette valeur est dictée par le seuil dans monitoring_config.domain_content_threshold.