本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
套用擴展政策
註冊模型並定義擴展政策後,請將擴展政策套用至已註冊的模型。本節說明如何使用 AWS Command Line Interface (AWS CLI) 或 Application Auto Scaling 套用擴展政策API。
套用目標追蹤擴展政策 (AWS CLI)
若要將擴展政策套用至模型,請使用 put-scaling-policy AWS CLI 命令搭配下列參數:
-
--policy-name
—擴展政策的名稱。 -
--policy-type
—將此值設定為TargetTrackingScaling
。 -
--resource-id
—此變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如:endpoint/
。my-endpoint
/variant/my-variant
-
--service-namespace
—將此值設定為sagemaker
。 -
--scalable-dimension
—將此值設定為sagemaker:variant:DesiredInstanceCount
。 -
--target-tracking-scaling-policy-configuration
- 用於模型的目標追蹤擴展政策組態。
下列範例會將名為 的目標追蹤擴展政策套用至
在my-scaling-policy
端點上執行my-endpoint
的名為 的變體。針對 my-variant
--target-tracking-scaling-policy-configuration
選項,指定您先前建立config.json
的檔案。
aws application-autoscaling put-scaling-policy \ --policy-name
my-scaling-policy
\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint
/variant/my-variant
\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
套用擴展政策 (Application Auto ScalingAPI)
若要使用 Application Auto Scaling 將擴展政策套用至變體API,請使用 PutScalingPolicy Application Auto Scaling API動作搭配下列參數:
-
PolicyName
—擴展政策的名稱。 -
ServiceNamespace
—將此值設定為sagemaker
。 -
ResourceID
—此變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如:endpoint/
。my-endpoint
/variant/my-variant
-
ScalableDimension
—將此值設定為sagemaker:variant:DesiredInstanceCount
。 -
PolicyType
—將此值設定為TargetTrackingScaling
。 -
TargetTrackingScalingPolicyConfiguration
—要用於變體的目標追蹤擴展政策組態。
下列範例會將名為 的目標追蹤擴展政策套用至
在my-scaling-policy
端點上執行my-endpoint
的名為 的變體。政策組態會將每個執行個體的平均叫用保持在 70。my-variant
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "
my-scaling-policy
", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0
, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }