Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Schéma des contraintes (fichier constraints.json)
Un fichier constraints.json est utilisé pour exprimer les contraintes qu'un jeu de données doit satisfaire. Les conteneurs Amazon SageMaker Model Monitor peuvent utiliser le fichier constraints.json pour évaluer les ensembles de données par rapport à ceux-ci. Les conteneurs préconçus permettent de générer automatiquement le fichier constraints.json pour un jeu de données de référence. Si vous apportez votre propre conteneur, vous pouvez lui attribuer des capacités similaires ou vous pouvez créer le fichier constraints.json d'une autre manière. Voici le schéma du fichier de contraintes utilisé par le conteneur préconçu. Les conteneurs personnalisés peuvent adopter le même format ou vous pouvez l'améliorer au besoin.
{ "version": 0, "features": [ { "name": "string", "inferred_type": "Integral" | "Fractional" | | "String" | "Unknown", "completeness": number, "num_constraints": { "is_non_negative": boolean }, "string_constraints": { "domains": [ "list of", "observed values", "for small cardinality" ] }, "monitoringConfigOverrides": {} } ], "monitoring_config": { "evaluate_constraints": "Enabled", "emit_metrics": "Enabled", "datatype_check_threshold": 0.1, "domain_content_threshold": 0.1, "distribution_constraints": { "perform_comparison": "Enabled", "comparison_threshold": 0.1, "comparison_method": "Simple"||"Robust", "categorical_comparison_threshold": 0.1, "categorical_drift_method": "LInfinity"||"ChiSquared" } } }
L'objet monitoring_config
contient des options pour surveiller la tâche pour la fonctionnalité. Le tableau suivant décrit chaque option.
Surveillance des contraintes
Contrainte | Description |
---|---|
evaluate_constraints |
Avec la valeur Valeurs valides : Par défaut : |
emit_metrics |
Quand Valeurs valides : Par défaut : |
datatype_check_threshold |
Si le seuil est supérieur à la valeur Au cours de l'étape de la référence, les contraintes générées suggèrent le type de données déduit pour chaque colonne. Le paramètre Valeurs valides : float Par défaut: 0.1 |
domain_content_threshold |
S'il existe plus de valeurs inconnues pour un champ de chaîne dans le jeu de données actif que dans le jeu de données de référence, ce seuil peut être utilisé pour déterminer si cela doit être signalé comme une violation. Valeurs valides : float Par défaut: 0.1 |
distribution_constraints |
perform_comparison
Avec la valeur Valeurs valides : Par défaut : |
comparison_threshold
Si le seuil est supérieur à la valeur définie pour Valeurs valides : float Par défaut: 0.1 |
|
comparison_method
Pour calculer Valeurs valides : |
|
categorical_comparison_threshold Facultatif. Définit un seuil pour les fonctionnalités catégorielles. Si la valeur du jeu de données dépasse le seuil que vous avez défini, une violation est enregistrée dans le rapport des violations. Valeurs valides : float Par défaut : valeur affectée au paramètre |
|
categorical_drift_method Facultatif. Pour les fonctionnalités catégorielles, spécifie la méthode de calcul utilisée pour détecter la dérive de distribution. Si vous ne définissez pas ce paramètre, le test K-S (LInfinity) est utilisé. Valeurs valides : Par défaut : |