本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
您可以通过描述扩展活动来检查自动扩缩端点的扩展活动状态。应用程序自动扩缩提供指定命名空间中前六周扩展活动的描述性信息。有关更多信息,请参阅《应用程序自动扩缩用户指南》中的应用程序自动扩缩活动。
要检查扩展活动的状态,请使用describe-scaling-activities命令。您无法使用管理控制台检查扩展活动的状态。
描述扩展活动 (AWS CLI)
要描述在 Application Auto Scaling 中注册的所有 SageMaker AI 资源的扩展活动,请使用sagemaker
为--service-namespace
选项指定describe-scaling-activities命令。
aws application-autoscaling describe-scaling-activities \
--service-namespace sagemaker
要描述特定资源的扩展活动,请使用 --resource-id
选项。
aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/
my-endpoint
/variant/my-variant
下面的示例显示运行此命令时产生的输出。
{
"ActivityId": "activity-id",
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/my-endpoint/variant/my-variant",
"ScalableDimension": "sagemaker:variant:DesiredInstanceCount",
"Description": "string",
"Cause": "string",
"StartTime": timestamp,
"EndTime": timestamp,
"StatusCode": "string",
"StatusMessage": "string"
}
从实例配额中识别受阻的扩展活动 (AWS CLI)
当您横向扩展(添加更多实例)时,可能会达到账户级实例配额。您可以使用describe-scaling-activities命令来检查是否已达到您的实例配额。当您超出限额时,自动扩缩将被阻止。
要检查您的实例配额是否已达到,请使用describe-scaling-activities命令并为该--resource-id
选项指定资源 ID。
aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/
my-endpoint
/variant/my-variant
在返回语法中,检查 StatusCode 和 StatusMessage 键及其关联的值。StatusCode
返回 Failed
。在 StatusMessage
中有一条消息,表明已达到账户级别的服务限额。消息类似于以下示例:
{
"ActivityId": "activity-id",
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/my-endpoint/variant/my-variant",
"ScalableDimension": "sagemaker:variant:DesiredInstanceCount",
"Description": "string",
"Cause": "minimum capacity was set to 110",
"StartTime": timestamp,
"EndTime": timestamp,
"StatusCode": "Failed",
"StatusMessage": "Failed to set desired instance count to 110. Reason: The
account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000
Instances, with current utilization of 997 Instances and a request delta
of 20 Instances. Please contact AWS support to request an increase for this
limit. (Service: AmazonSageMaker; Status Code: 400;
Error Code: ResourceLimitExceeded; Request ID: request-id)."
}