Controlla lo stato di un'attività di scalabilità descrivendo le attività di scalabilità - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Controlla lo stato di un'attività di scalabilità descrivendo le attività di scalabilità

Puoi controllare lo stato di un'attività di scalabilità per il tuo endpoint con scalabilità automatica descrivendo le attività di scalabilità. Application Auto Scaling fornisce informazioni descrittive sulle attività di scalabilità nello spazio dei nomi specificato delle sei settimane precedenti. Per ulteriori informazioni, vedere Scaling activities for Application Auto Scaling nella Application Auto Scaling User Guide.

Per verificare lo stato di un'attività di ridimensionamento, utilizzate il comando. describe-scaling-activities Non è possibile controllare lo stato di un'attività di scalabilità utilizzando la console.

Descrivi le attività di ridimensionamento ()AWS CLI

Per descrivere le attività di scalabilità per tutte le SageMaker risorse registrate con Application Auto Scaling, utilizzate describe-scaling-activitiesil comando, sagemaker specificando l'opzione. --service-namespace

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker

Per descrivere le attività di ridimensionamento per una risorsa specifica, includi l'opzione. --resource-id

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

L'esempio seguente mostra l'output prodotto quando si esegue questo comando.

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "string", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "string", "StatusMessage": "string" }

Identifica le attività di scalabilità bloccate dall'istanza quotas ()AWS CLI

Quando esegui la scalabilità orizzontale (aggiungi altre istanze), potresti raggiungere la quota di istanze a livello di account. Puoi usare il describe-scaling-activitiescomando per verificare se hai raggiunto la quota di istanza. Quando si supera la quota, la scalabilità automatica viene bloccata.

Per verificare se hai raggiunto la quota di istanza, usa il describe-scaling-activitiescomando e specifica l'ID della risorsa per l'--resource-idopzione.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

All'interno della sintassi return, controlla le StatusMessagechiavi StatusCodeand e i valori associati. StatusCoderestituisceFailed. All'interno di StatusMessage è presente un messaggio che indica che è stata raggiunta la quota di servizio a livello di account. Di seguito è riportato un esempio di come tale messaggio potrebbe presentarsi:

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "minimum capacity was set to 110", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "Failed", "StatusMessage": "Failed to set desired instance count to 110. Reason: The account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000 Instances, with current utilization of 997 Instances and a request delta of 20 Instances. Please contact AWS support to request an increase for this limit. (Service: AmazonSageMaker; Status Code: 400; Error Code: ResourceLimitExceeded; Request ID: request-id)." }