Entradas de contrato de contenedor - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Entradas de contrato de contenedor

La plataforma Amazon SageMaker Model Monitor invoca el código de su contenedor según un cronograma específico. Si elige escribir su propio código de contenedor, están disponibles las siguientes variables de entorno. En este contexto, puede analizar el conjunto de datos actual o evaluar las restricciones si decide emitir métricas, si procede.

Las variables de entorno disponibles son las mismas para los puntos de conexión en tiempo real y los trabajos de transformación por lotes, excepto para la variable dataset_format. Si utiliza un punto de conexión en tiempo real, la variable dataset_format admite las siguientes opciones:

{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}

Si utiliza un trabajo de transformación por lotes, dataset_format admite las siguientes opciones:

{\"csv\": {\"header\": [\"true\",\"false\"]}}
{\"json\": {\"line\": [\"true\",\"false\"]}}
{\"parquet\": {}}

El siguiente ejemplo de código muestra el conjunto completo de variables de entorno disponibles para el código de contenedor (y utiliza el formato dataset_format para un punto de conexión en tiempo real).

"Environment": { "dataset_format": "{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}", "dataset_source": "/opt/ml/processing/endpointdata", "end_time": "2019-12-01T16: 20: 00Z", "output_path": "/opt/ml/processing/resultdata", "publish_cloudwatch_metrics": "Disabled", "sagemaker_endpoint_name": "endpoint-name", "sagemaker_monitoring_schedule_name": "schedule-name", "start_time": "2019-12-01T15: 20: 00Z" }

Parámetros

Nombre del parámetro Descripción
dataset_format

Para un trabajo iniciado a partir de un MonitoringSchedule respaldado por un Endpoint, esto es sageMakerCaptureJson con los índices de captura endpointInput o endpointOutput, o ambos. En el caso de un trabajo de transformación por lotes, se especifica el formato de datos CSVJSON, ya sea Parquet o Parquet.

dataset_source

S usa un punto de conexión en tiempo real, la ruta local en la que están disponibles los datos correspondientes al período de supervisión, según lo especificado por start_time y end_time. En esta ruta, los datos están disponibles en /{endpoint-name}/{variant-name}/yyyy/mm/dd/hh.

A veces descargamos más de lo que especifican las horas de inicio y fin. Depende del código contenedor analizar los datos según sea necesario.

output_path

La ruta local para escribir informes de salida y otros archivos. Debe especificar este parámetro en la solicitud CreateMonitoringSchedule como MonitoringOutputConfig.MonitoringOutput[0].LocalPath. Se carga en la ruta de S3Uri especificada en MonitoringOutputConfig.MonitoringOutput[0].S3Uri.

publish_cloudwatch_metrics

Para un trabajo iniciado por CreateMonitoringSchedule, este parámetro se establece en Enabled. El contenedor puede elegir escribir el archivo de CloudWatch salida de Amazon en[filepath].

sagemaker_endpoint_name

Si utiliza un punto de conexión en tiempo real, el nombre del Endpoint para el que se lanzó este trabajo programado.

sagemaker_monitoring_schedule_name

El nombre de la MonitoringSchedule que lanzó este trabajo.

*sagemaker_endpoint_datacapture_prefix*

Si utiliza un punto de conexión en tiempo real, el prefijo especificado en el parámetro DataCaptureConfig del Endpoint. El contenedor puede usarlo si necesita acceder directamente a más datos de los que ya ha descargado SageMaker en la dataset_source ruta.

start_time, end_time

Se ejecuta la ventana de tiempo para este análisis. Por ejemplo, para un trabajo programado para ejecutarse a las 05:00 UTC y otro que se ejecute el 20 de febrero de 2020,start_time: es 2020-02-19T 06:00:00 Z y: es 2020-02-20T 05:00:00 Z end_time

baseline_constraints:

La ruta local del archivo de restricción de referencia especificado en BaselineConfig.ConstraintResource.S3Uri. Esto solo está disponible si este parámetro se especificó en la solicitud CreateMonitoringSchedule.

baseline_statistics

La ruta de acceso local al archivo de estadísticas de referencia especificado en BaselineConfig.StatisticsResource.S3Uri. Esto solo está disponible si este parámetro se especificó en la solicitud CreateMonitoringSchedule: