Input contratto container - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Input contratto container

La piattaforma Amazon SageMaker Model Monitor richiama il codice del contenitore in base a una pianificazione specificata. Se scegli di scrivere il tuo codice container, sono disponibili le seguenti variabili di ambiente. In questo contesto, è possibile analizzare il set di dati corrente o valutare i vincoli se si sceglie di emettere parametri, se applicabili.

Le variabili di ambiente disponibili sono le stesse per gli endpoint in tempo reale e i processi di trasformazione di batch, ad eccezione della variabile dataset_format. Se si utilizza un endpoint in tempo reale, la variabile dataset_format supporta le seguenti opzioni:

{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}

Se si utilizza un processo di trasformazione di batch, dataset_format supporta le seguenti opzioni:

{\"csv\": {\"header\": [\"true\",\"false\"]}}
{\"json\": {\"line\": [\"true\",\"false\"]}}
{\"parquet\": {}}

Il seguente esempio di codice mostra il set completo di variabili di ambiente disponibili per il codice del container (e utilizza il formato dataset_format per endpoint in tempo reale).

"Environment": { "dataset_format": "{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}", "dataset_source": "/opt/ml/processing/endpointdata", "end_time": "2019-12-01T16: 20: 00Z", "output_path": "/opt/ml/processing/resultdata", "publish_cloudwatch_metrics": "Disabled", "sagemaker_endpoint_name": "endpoint-name", "sagemaker_monitoring_schedule_name": "schedule-name", "start_time": "2019-12-01T15: 20: 00Z" }
Parametri
Nome parametro Descrizione
dataset_format

Per un processo avviato da un MonitoringSchedule sostenuto da un Endpoint, è sageMakerCaptureJson con gli indici di acquisizione endpointInput oppure endpointOutput, o entrambi. Per un processo di trasformazione di batch, specifica il formato dei dati, che sia CSV, JSON o Parquet.

dataset_source

Se stai utilizzando un endpoint in tempo reale, il percorso locale in cui sono disponibili i dati corrispondenti al periodo di monitoraggio, come specificato da start_time e end_time. In questo percorso, i dati sono disponibili in /{endpoint-name}/{variant-name}/yyyy/mm/dd/hh.

A volte scarichiamo più di quanto specificato dagli orari di inizio e fine. Il codice container ha il compito di analizzare i dati come richiesto.

output_path

Il percorso locale per scrivere report di output e altri file. È necessario specificare questo parametro nella richiesta CreateMonitoringSchedule come MonitoringOutputConfig.MonitoringOutput[0].LocalPath. Viene caricato nel percorso S3Uri specificato in MonitoringOutputConfig.MonitoringOutput[0].S3Uri.

publish_cloudwatch_metrics

Per un processo avviato da CreateMonitoringSchedule, questo parametro è impostato su Enabled. Il contenitore può scegliere di scrivere il file CloudWatch di output di Amazon in[filepath].

sagemaker_endpoint_name

Se si utilizza un endpoint in tempo reale, il nome del Endpoint per cui è stato avviato il processo pianificato.

sagemaker_monitoring_schedule_name

Il nome del MonitoringSchedule che ha avviato questo processo.

*sagemaker_endpoint_datacapture_prefix*

Se si utilizza un endpoint in tempo reale, il prefisso specificato nel parametro DataCaptureConfig del Endpoint. Il contenitore può utilizzarlo se deve accedere direttamente a più dati di quelli già scaricati da SageMaker nel dataset_source percorso.

start_time, end_time

La finestra temporale per l'esecuzione di questa analisi. Ad esempio, per un'attività la cui esecuzione è pianificata alle 05:00 UTC e per un'attività eseguita il 20/02/2020, start_time è 2020-02-19T 06:00:00 Z e end_time è 2020-02-20T 05:00:00 Z

baseline_constraints:

Il percorso locale del file di vincolo della linea di base specificato in BaselineConfig.ConstraintResource.S3Uri. Questo parametro è disponibile solo se è stato specificato nella richiesta CreateMonitoringSchedule.

baseline_statistics

Il percorso locale del file di statistiche della linea di base specificato in BaselineConfig.StatisticsResource.S3Uri. Questo parametro è disponibile solo se è stato specificato nella richiesta CreateMonitoringSchedule.