套用擴展政策 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

套用擴展政策

註冊模型並定義擴展政策後,請將擴展政策套用至已註冊的模型。本節說明如何使用 AWS Command Line Interface (AWS CLI) 或 Application Auto Scaling 套用擴展政策API。

套用目標追蹤擴展政策 (AWS CLI)

若要將擴展政策套用至模型,請使用 put-scaling-policy AWS CLI 命令搭配下列參數:

  • --policy-name—擴展政策的名稱。

  • --policy-type—將此值設定為 TargetTrackingScaling

  • --resource-id—此變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如:endpoint/my-endpoint/variant/my-variant

  • --service-namespace—將此值設定為 sagemaker

  • --scalable-dimension—將此值設定為 sagemaker:variant:DesiredInstanceCount

  • --target-tracking-scaling-policy-configuration- 用於模型的目標追蹤擴展政策組態。

下列範例會將名為 的目標追蹤擴展政策套用至my-scaling-policymy-endpoint端點上執行my-variant的名為 的變體。針對 --target-tracking-scaling-policy-configuration選項,指定您先前建立config.json的檔案。

aws application-autoscaling put-scaling-policy \ --policy-name my-scaling-policy \ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint/variant/my-variant \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json

套用擴展政策 (Application Auto ScalingAPI)

若要使用 Application Auto Scaling 將擴展政策套用至變體API,請使用 PutScalingPolicy Application Auto Scaling API動作搭配下列參數:

  • PolicyName—擴展政策的名稱。

  • ServiceNamespace—將此值設定為 sagemaker

  • ResourceID—此變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如:endpoint/my-endpoint/variant/my-variant

  • ScalableDimension—將此值設定為 sagemaker:variant:DesiredInstanceCount

  • PolicyType—將此值設定為 TargetTrackingScaling

  • TargetTrackingScalingPolicyConfiguration—要用於變體的目標追蹤擴展政策組態。

下列範例會將名為 的目標追蹤擴展政策套用至my-scaling-policymy-endpoint端點上執行my-variant的名為 的變體。政策組態會將每個執行個體的平均叫用保持在 70。

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "my-scaling-policy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue": 70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }