本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用佈建並行為您的無伺服器端點使用自動擴展之後,您應該清除您建立的資源。這包括刪除擴展政策,並從 Application Auto Scaling 取消註冊模型。清理可確保您不會再為不再使用的資源產生不必要的成本。
刪除擴展政策
您可以使用 AWS Management Console、 AWS CLI或 Application Auto Scaling API 刪除擴展政策。如需使用 刪除擴展政策的詳細資訊 AWS Management Console,請參閱 SageMaker AI 自動擴展文件中刪除擴展政策的 。 SageMaker
刪除擴展政策 (AWS CLI)
若要將擴展政策套用到您的模型,請使用 delete-scaling-policy
AWS CLI命令搭配下列參數:
-
--policy-name
– 擴展政策的名稱。 -
--resource-id
— 變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant
。 -
--service-namespace
– 將此值設定為sagemaker
。 -
--scalable-dimension
– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency
。
下列的範例從名為 MyVariant
的模型中,刪除了名為 MyScalingPolicy
的擴展政策。
aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
刪除擴展政策 (應用程式自動擴展 API)
若要從模型刪除擴展政策,請使用 DeleteScalingPolicy
應用程式自動擴展 API 動作並搭配下列參數:
-
PolicyName
– 擴展政策的名稱。 -
ResourceId
— 變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant
。 -
ServiceNamespace
– 將此值設定為sagemaker
。 -
ScalableDimension
– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency
。
以下範例使用應用程式自動擴展 API,從名為 MyVariant
的模型刪除名為 MyScalingPolicy
的擴展政策。
POST / HTTP/1.1
Host: autoscaling.us-east-2.amazonaws.com
Accept-Encoding: identity
X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy
X-Amz-Date: 20160506T182145Z
User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8
Content-Type: application/x-amz-json-1.1
Authorization: AUTHPARAMS
{
"PolicyName": "MyScalingPolicy",
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/MyEndpoint/variant/MyVariant",
"ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency",
}
取消註冊模型
您可以使用 AWS Management Console、 AWS CLI或 Application Auto Scaling API 取消註冊模型。
取消註冊模型 (AWS CLI)
若要取消註冊應用程式自動擴展模型,請使用 deregister-scalable-target
AWS CLI; 命令並搭配下列參數:
-
--resource-id
— 變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant
。 -
--service-namespace
– 將此值設定為sagemaker
。 -
--scalable-dimension
– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency
。
以下範例可看到如何從應用程式自動擴展取消註冊名為 MyVariant
的模型。
aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
取消註冊模型 (應用程式自動擴展 API)
若要從應用程式自動擴展取消註冊模型,請使用 DeregisterScalableTarget
應用程式自動擴展 API 動作並搭配下列參數:
-
ResourceId
— 變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant
。 -
ServiceNamespace
– 將此值設定為sagemaker
。 -
ScalableDimension
– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency
。
下列範例使用應用程式自動擴展 API,以從應用程式自動擴展取消註冊名為 MyVariant
的模型。
POST / HTTP/1.1
Host: autoscaling.us-east-2.amazonaws.com
Accept-Encoding: identity
X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget
X-Amz-Date: 20160506T182145Z
User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8
Content-Type: application/x-amz-json-1.1
Authorization: AUTHPARAMS
{
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/MyEndpoint/variant/MyVariant",
"ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency",
}
取消註冊模型 (AWS Management Console)
若要使用 取消註冊模型 (生產變體) AWS Management Console:
-
在導覽窗格中,選擇 Inference (推論)。
-
選擇 Endpoints (端點) 以檢視端點清單。
-
選擇託管生產變體的無伺服器端點。畫面將顯示一個包含端點設定的頁面,其中生產變體會列在 Endpoint runtime settings (端點執行期設定)區段下方。
-
選取您要取消註冊的生產變體,然後選擇 Configure auto scaling (設定 Auto Scaling)。畫面會顯示 Configure variant automatic scaling (設定變體自動擴展) 對話框。
-
選擇取消登錄自動擴展。