Container-Vertragseingaben - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Container-Vertragseingaben

Die Amazon SageMaker Model Monitor-Plattform ruft Ihren Containercode nach einem bestimmten Zeitplan auf. Wenn Sie Ihren eigenen Container-Code schreiben möchten, stehen Ihnen die folgenden Umgebungsvariablen zur Verfügung. In diesem Zusammenhang können Sie den aktuellen Datensatz analysieren oder die Constraints auswerten und gegebenenfalls Metriken ausgeben.

Die verfügbaren Umgebungsvariablen sind für Echtzeit-Endpunkte und Batch-Transformationsaufträge identisch, mit Ausnahme der dataset_format Variablen. Wenn Sie einen Echtzeit-Endpunkt verwenden, unterstützt die dataset_format Variable die folgenden Optionen:

{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}

Wenn Sie einen Batch-Transformationsauftrag verwenden, dataset_format unterstützt der die folgenden Optionen:

{\"csv\": {\"header\": [\"true\",\"false\"]}}
{\"json\": {\"line\": [\"true\",\"false\"]}}
{\"parquet\": {}}

Das folgende Codebeispiel zeigt den vollständigen Satz von Umgebungsvariablen, die für Ihren Container-Code verfügbar sind (und verwendet das dataset_format Format für einen Echtzeit-Endpunkt).

"Environment": { "dataset_format": "{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}", "dataset_source": "/opt/ml/processing/endpointdata", "end_time": "2019-12-01T16: 20: 00Z", "output_path": "/opt/ml/processing/resultdata", "publish_cloudwatch_metrics": "Disabled", "sagemaker_endpoint_name": "endpoint-name", "sagemaker_monitoring_schedule_name": "schedule-name", "start_time": "2019-12-01T15: 20: 00Z" }
Parameter
Name des Parameters Beschreibung
dataset_format

Bei einem Auftrag, der von einem MonitoringSchedule, unterstützt von einem Endpoint, gestartet wurde, handelt es sich um sageMakerCaptureJson mit den Erfassungsindizes endpointInput oder endpointOutput oder beides. Für einen Batch-Transformationsjob gibt dies das Datenformat an, ob CSV, JSON oder Parquet.

dataset_source

Wenn Sie einen Echtzeit-Endpunkt verwenden, den lokalen Pfad, in dem die Daten, die dem durch start_time und end_time angegebenen Überwachungszeitraum entsprechen, verfügbar sind. In diesem Pfad sind die Daten in /{endpoint-name}/{variant-name}/yyyy/mm/dd/hh verfügbar.

Manchmal laden wir mehr als das herunter, was durch die Start- und Endzeiten angegeben wird. Es liegt an dem Containercode, die Daten nach Bedarf zu analysieren.

output_path

Der lokale Pfad zum Schreiben von Ausgabeberichten und anderen Dateien. Sie müssen diesen Parameter in der Anforderung CreateMonitoringSchedule als MonitoringOutputConfig.MonitoringOutput[0].LocalPath angeben. Es wird in den in MonitoringOutputConfig.MonitoringOutput[0].S3Uri angegebenen Pfad S3Uri hochgeladen.

publish_cloudwatch_metrics

Für einen von CreateMonitoringSchedule gestarteten Auftrag, ist dieser Parameter auf Enabled eingestellt. Der Container kann die Amazon- CloudWatch Ausgabedatei unter schreiben[filepath].

sagemaker_endpoint_name

Wenn Sie einen Echtzeit-Endpunkt verwenden, den Namen des Endpoint, für den dieser geplante Auftrag gestartet wurde.

sagemaker_monitoring_schedule_name

Der Name des MonitoringSchedule, der diesen Auftrag gestartet hat.

*sagemaker_endpoint_datacapture_prefix*

Wenn Sie einen Echtzeit-Endpunkt verwenden, muss das Präfix, das im DataCaptureConfig Parameter des Endpoint. Der Container kann dies verwenden, wenn er direkt auf mehr Daten zugreifen muss, als bereits von SageMaker im dataset_source Pfad heruntergeladen wurden.

start_time, end_time

Das Zeitfenster für diesen Analyselauf. Beispiel: Bei einem Auftrag, dessen Ausführung um 05:00 UTC geplant ist, und einem Auftrag, der am 20/02/2020 ausgeführt wird, ist start_time: 2020-02-19T06:00:00Z und end_time: ist 2020-02-20T05:00:00Z

baseline_constraints:

Der lokale Pfad der in BaselineConfig.ConstraintResource.S3Uri angegebenen Baseline-Einschränkungsdatei. Dies ist nur verfügbar, wenn dieser Parameter in der CreateMonitoringSchedule-Anforderung angegeben wurde.

baseline_statistics

Der lokale Pfad zur Baseline-Statistikdatei, die in BaselineConfig.StatisticsResource.S3Uri angegeben wird. Dies ist nur verfügbar, wenn dieser Parameter in der CreateMonitoringSchedule-Anforderung angegeben wurde.