Verifique o status de uma atividade de escalabilidade descrevendo as atividades de escalabilidade - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Verifique o status de uma atividade de escalabilidade descrevendo as atividades de escalabilidade

Você pode verificar o status de uma atividade de escalabilidade para seu endpoint com escalabilidade automática descrevendo as atividades de escalabilidade. O Application Auto Scaling fornece informações descritivas sobre as atividades de escalabilidade no namespace especificado nas seis semanas anteriores. Para obter mais informações, consulte Atividades de escalabilidade para Application Auto Scaling no Guia do usuário do Application Auto Scaling.

Para verificar o status de uma atividade de escalabilidade, use o describe-scaling-activitiescomando. Você não pode verificar o status de uma atividade de escalabilidade usando o console.

Descrever as atividades de escalabilidade ()AWS CLI

Para descrever as atividades de escalabilidade de todos os SageMaker recursos registrados no Application Auto Scaling, use describe-scaling-activitieso comando, sagemaker especificando a opção. --service-namespace

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker

Para descrever as atividades de escalabilidade para um recurso específico, inclua a --resource-id opção.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

O exemplo a seguir mostra a saída produzida quando você executa esse comando.

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "string", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "string", "StatusMessage": "string" }

Identifique atividades de escalabilidade bloqueadas a partir das cotas de instância ()AWS CLI

Ao expandir (adicionar mais instâncias), você pode atingir sua cota de instâncias no nível da conta. Você pode usar o describe-scaling-activitiescomando para verificar se atingiu sua cota de instância. Quando você excede sua cota, o escalonamento automático é bloqueado.

Para verificar se você atingiu sua cota de instância, use o describe-scaling-activitiescomando e especifique o ID do recurso para a --resource-id opção.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

Na sintaxe de retorno, verifique as StatusMessagechaves StatusCodee e seus valores associados. StatusCodedevoluçõesFailed. Dentro de StatusMessage, há uma mensagem indicando que a cota de serviço no nível da conta foi atingida. Veja a seguir um exemplo da possível aparência que a mensagem pode ter:

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "minimum capacity was set to 110", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "Failed", "StatusMessage": "Failed to set desired instance count to 110. Reason: The account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000 Instances, with current utilization of 997 Instances and a request delta of 20 Instances. Please contact AWS support to request an increase for this limit. (Service: AmazonSageMaker; Status Code: 400; Error Code: ResourceLimitExceeded; Request ID: request-id)." }