Entrées du contrat de conteneur - Amazon SageMaker

Entrées du contrat de conteneur

La plateforme Amazon SageMaker Model Monitor appelle votre code de conteneur selon un programme spécifié. Si vous avez choisi d'écrire votre propre code de conteneur, les variables d'environnement suivantes sont disponibles pour ce code. Dans ce contexte, vous pouvez analyser l'ensemble de données actif ou évaluer les contraintes si vous le souhaitez et émettre des métriques, le cas échéant.

"Environment": { "dataset_format": "{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}", "dataset_source": "/opt/ml/processing/endpointdata", "end_time": "2019-12-01T16: 20: 00Z", "output_path": "/opt/ml/processing/resultdata", "publish_cloudwatch_metrics": "Disabled", "sagemaker_endpoint_name": "endpoint-name", "sagemaker_monitoring_schedule_name": "schedule-name", "start_time": "2019-12-01T15: 20: 00Z" }
Paramètres
Nom du paramètre Description
dataset_format

Pour une tâche démarrée à partir d'un MonitoringSchedule basé sur un Endpoint, il s'agit de sageMakerCaptureJson avec les indices de capture endpointInput et/ou endpointOutput.

dataset_source

Chemin d'accès local dans lequel les données correspondant à la période de surveillance, comme spécifié par start_time et end_time, sont disponibles. Dans ce chemin d'accès, les données sont disponibles dans /{endpoint-name}/{variant-name}/yyyy/mm/dd/hh.

Nous téléchargeons parfois plus de données que ce qui est spécifié par les heures de début et de fin. C'est au code de conteneur d'analyser les données selon les besoins.

output_path

Chemin d'accès local où écrire des rapports de sortie et d'autres fichiers. Vous devez spécifier ce paramètre dans la demande CreateMonitoringSchedule comme MonitoringOutputConfig.MonitoringOutput[0].LocalPath. Il est chargé dans le chemin d'accès S3Uri spécifié dans MonitoringOutputConfig.MonitoringOutput[0].S3Uri.

publish_cloudwatch_metrics

Pour une tâche lancée par CreateMonitoringSchedule, ce paramètre est défini sur Enabled. Le conteneur peut choisir d'écrire le fichier de sortie Amazon CloudWatch dans [filepath].

sagemaker_endpoint_name

Nom du Endpoint pour lequel cette tâche planifiée a été lancée.

sagemaker_monitoring_schedule_name

Nom du MonitoringSchedule qui a lancé cette tâche.

*sagemaker_endpoint_datacapture_prefix*

Le préfixe spécifié dans le paramètre DataCaptureConfig du Endpoint. Le conteneur peut l'utiliser s'il a besoin d'accéder directement à plus de données que celles déjà téléchargées par SageMaker au chemin d'accès dataset_source.

start_time, end_time

Fenêtre horaire pour l'analyse exécutée. Par exemple, pour une tâche planifiée pour s'exécuter à 5 h 00 UTC et une tâche qui s'exécute le 20/02/202, start_time : est 2020-02-19T06:00:00Z et end_time : est 2020-02-20T05:00:00Z

baseline_constraints:

Chemin d'accès local du fichier de contrainte de référence spécifié dans BaselineConfig.ConstraintResource.S3Uri. Ce paramètre est disponible uniquement si ce paramètre a été spécifié dans la demande CreateMonitoringSchedule.

baseline_statistics

Chemin d'accès local au fichier de statistiques de référence spécifié dans BaselineConfig.StatisticsResource.S3Uri. Ce paramètre est disponible uniquement si ce paramètre a été spécifié dans la demande CreateMonitoringSchedule.