Monitore um endpoint sem servidor - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Monitore um endpoint sem servidor

Para monitorar seu endpoint sem servidor, você pode usar os alarmes da Amazon. CloudWatch CloudWatch é um serviço que coleta métricas em tempo real de seus AWS aplicativos e recursos. Um alarme monitora as métricas à medida que elas são coletadas e oferece a capacidade de pré-especificar um limite e as ações a serem tomadas se esse limite for violado. Por exemplo, seu CloudWatch alarme pode enviar uma notificação se seu endpoint ultrapassar um limite de erro. Ao configurar CloudWatch alarmes, você ganha visibilidade do desempenho e da funcionalidade do seu endpoint. Para obter mais informações sobre CloudWatch alarmes, consulte Usando CloudWatch alarmes da Amazon no Guia CloudWatch do usuário da Amazon.

Monitoramento com CloudWatch

As métricas abaixo são uma lista completa de métricas para endpoints sem servidor. Qualquer métrica não listada abaixo não é publicada para endpoints sem servidor. Para obter informações sobre as seguintes métricas, consulte Monitorar a Amazon SageMaker com a Amazon CloudWatch.

Métricas gerais de endpoint

Essas CloudWatch métricas são as mesmas publicadas para endpoints em tempo real.

A OverheadLatency métrica rastreia toda a latência adicional SageMaker adicionada, incluindo o horário de inicialização a frio para o lançamento de novos recursos de computação para seu endpoint sem servidor. Em comparação com os endpoints sem servidor sob demanda, o número de endpoints sem servidor com OverheadLatency simultaneidade provisionada geralmente é significativamente menor.

Os endpoints sem servidor também podem usar as métricas Invocations4XXErrors, Invocations5XXErrors, Invocations, ModelLatency, ModelSetupTime e MemoryUtilization. Para saber mais sobre essas métricas, consulte SageMaker Métricas de invocação de endpoints.

Métricas gerais de endpoint de tecnologia sem servidor

Essas CloudWatch métricas são publicadas tanto para endpoints sem servidor sob demanda quanto para endpoints sem servidor com simultaneidade provisionada.

Nome da métrica Descrição Unidade/Estatísticas
ServerlessConcurrentExecutionsUtilization O número de execuções simultâneas dividido pela simultaneidade máxima.

Unidades: nenhuma

Estatísticas válidas: média, máx. e mín.

Endpoint sem servidor com métrica de simultaneidade provisionada

Essas CloudWatch métricas são publicadas para endpoints sem servidor com simultaneidade provisionada.

Nome da métrica Descrição Unidade/Estatísticas
ServerlessProvisionedConcurrencyExecutions O número de execuções simultâneas que estão sendo processadas pelo endpoint.

Unidades: contagem

Estatísticas válidas: média, máx. e mín.

ServerlessProvisionedConcurrencyUtilization O número de execuções simultâneas dividido pela simultaneidade provisionada alocada.

Unidades: nenhuma

Estatísticas válidas: média, máx. e mín.

ServerlessProvisionedConcurrencyInvocations O número de solicitações InvokeEndpoint tratadas pela simultaneidade provisionada.

Unidades: contagem

Estatísticas válidas: média, máx. e mín.

ServerlessProvisionedConcurrencySpilloverInvocations O número de solicitações InvokeEndpoint não tratadas pela simultaneidade provisionada, que é tratada pela inferência sem servidor sob demanda.

Unidades: contagem

Estatísticas válidas: média, máx. e mín.

Logs

Se você quiser monitorar os registros do seu endpoint para depuração ou análise de progresso, você pode usar o Amazon Logs. CloudWatch O grupo SageMaker de registros fornecido que você pode usar para endpoints sem servidor é. /aws/sagemaker/Endpoints/[EndpointName] Para obter mais informações sobre como usar o CloudWatch Login SageMaker, consulteRegistre SageMaker eventos da Amazon com a Amazon CloudWatch. Para saber mais sobre CloudWatch registros, consulte O que é o Amazon CloudWatch Logs? no Guia do usuário do Amazon CloudWatch Logs.