Entradas do contrato de contêiner - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Entradas do contrato de contêiner

A plataforma Amazon SageMaker Model Monitor invoca seu código de contêiner de acordo com um cronograma especificado. Se você optar por escrever seu próprio código de contêiner, as variáveis de ambiente a seguir estarão disponíveis. Nesse contexto, será possível analisar o conjunto de dados atual ou avaliar as restrições se escolher e emitir métricas, se aplicável.

As variáveis de ambiente disponíveis são as mesmas para endpoints em tempo real e trabalhos de transformação de lotes, exceto pela variável dataset_format. Se você estiver usando um endpoint em tempo real, a variável dataset_format oferece suporte às seguintes opções:

{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}

Se você estiver usando um trabalho de transformação de lotes, o dataset_format é compatível com as seguintes opções:

{\"csv\": {\"header\": [\"true\",\"false\"]}}
{\"json\": {\"line\": [\"true\",\"false\"]}}
{\"parquet\": {}}

O exemplo de código a seguir mostra o conjunto completo de variáveis de ambiente disponíveis para seu código de contêiner (e usa o formato dataset_format para um endpoint em tempo real).

"Environment": { "dataset_format": "{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}", "dataset_source": "/opt/ml/processing/endpointdata", "end_time": "2019-12-01T16: 20: 00Z", "output_path": "/opt/ml/processing/resultdata", "publish_cloudwatch_metrics": "Disabled", "sagemaker_endpoint_name": "endpoint-name", "sagemaker_monitoring_schedule_name": "schedule-name", "start_time": "2019-12-01T15: 20: 00Z" }

Parâmetros

Nome do parâmetro Descrição
dataset_format

Para um trabalho iniciado a partir de um MonitoringSchedule com base em um Endpoint, isso é sageMakerCaptureJson com os índices de captura endpointInput, endpointOutput ou ambos. Para um trabalho de transformação em lote, isso especifica o formato dos dados, se CSVJSON, ou o Parquet.

dataset_source

Se você estiver usando um endpoint em tempo real, o caminho local no qual os dados correspondentes ao período de monitoramento, conforme especificado por start_time e end_time, estão disponíveis. Nesse caminho, os dados estão disponíveis em /{endpoint-name}/{variant-name}/yyyy/mm/dd/hh.

Às vezes, fazemos download mais do que o especificado pelos horários de início e de término. Cabe ao código do contêiner analisar os dados conforme necessário.

output_path

O caminho local para gravar relatórios de saída e outros arquivos. Especifique esse parâmetro na solicitação CreateMonitoringSchedule como MonitoringOutputConfig.MonitoringOutput[0].LocalPath. É feito upload dele no caminho S3Uri especificado em MonitoringOutputConfig.MonitoringOutput[0].S3Uri.

publish_cloudwatch_metrics

Para um trabalho executado por CreateMonitoringSchedule, esse parâmetro é definido como Enabled. O contêiner pode escolher gravar o arquivo CloudWatch de saída da Amazon em[filepath].

sagemaker_endpoint_name

Se você estiver usando um endpoint em tempo real, o nome do Endpoint para o qual esse trabalho programado foi iniciado.

sagemaker_monitoring_schedule_name

O nome do MonitoringSchedule que executou esse trabalho.

*sagemaker_endpoint_datacapture_prefix*

Se você estiver usando um endpoint em tempo real, o prefixo especificado no parâmetro DataCaptureConfig do Endpoint. O contêiner pode usar isso se precisar acessar diretamente mais dados do que os já baixados SageMaker no dataset_source caminho.

start_time, end_time

A janela de tempo para a execução dessa análise. Por exemplo, para um trabalho programado para execução às 05:00 UTC e um trabalho executado em 20/02/2020,: é 2020-02-19T 06:00:00 Z estart_time: é 2020-02-20T 05:00:00 Z end_time

baseline_constraints:

O caminho local do arquivo de restrição de linha de base especificado em BaselineConfig.ConstraintResource.S3Uri. Isso só estará disponível se esse parâmetro tiver sido especificado na solicitação CreateMonitoringSchedule.

baseline_statistics

O caminho local para o arquivo de estatísticas da linha de base especificado em BaselineConfig.StatisticsResource.S3Uri. Isso só estará disponível se esse parâmetro tiver sido especificado na solicitação CreateMonitoringSchedule.