기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
프로비저닝된 동시성을 사용하여 서버리스 엔드포인트에 대한 자동 크기 조정 사용을 완료한 후에는 생성한 리소스를 정리해야 합니다. 여기에는 조정 정책을 삭제하고 Application Auto Scaling에서 모델을 등록 취소하는 작업이 포함됩니다. 정리하면 더 이상 사용하지 않는 리소스에 불필요한 비용이 발생하지 않습니다.
스케일링 정책 삭제
AWS Management Console, AWS CLI또는 Application Auto Scaling API를 사용하여 조정 정책을 삭제할 수 있습니다. 를 사용하여 조정 정책을 삭제하는 방법에 대한 자세한 내용은 SageMaker AI Autoscaling 설명서스케일링 정책 삭제의 섹션을 AWS Management Console참조하세요.
스케일링 정책 삭제(AWS CLI)
모델에 스케일링 정책을 적용하려면 다음 파라미터와 함께 delete-scaling-policy
AWS CLI; 명령을 사용하세요.
-
--policy-name
– 조정 정책의 이름입니다. -
--resource-id
- 변형의 리소스 식별자. 이 파라미터에서 리소스 유형은endpoint
이고 고유 식별자는 변형의 이름입니다. 예:endpoint/MyEndpoint/variant/MyVariant
. -
--service-namespace
- 이 값을sagemaker
로 설정하세요. -
--scalable-dimension
- 이 값을sagemaker:variant:DesiredProvisionedConcurrency
로 설정하세요.
다음 예제에서는 MyVariant
(이)라는 이름의 모델에서 MyScalingPolicy
(이)라는 이름의 스케일링 정책을 삭제합니다.
aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
스케일링 정책 삭제(Application Auto Scaling API)
모델에서 스케일링 정책을 삭제하려면 다음 파라미터와 함께 DeleteScalingPolicy
Application Auto Scaling API 작업을 사용하세요.
-
PolicyName
– 조정 정책의 이름입니다. -
ResourceId
- 변형의 리소스 식별자. 이 파라미터에서 리소스 유형은endpoint
이고 고유 식별자는 변형의 이름입니다. 예:endpoint/MyEndpoint/variant/MyVariant
. -
ServiceNamespace
- 이 값을sagemaker
로 설정하세요. -
ScalableDimension
- 이 값을sagemaker:variant:DesiredProvisionedConcurrency
로 설정하세요.
다음 예제에서는 Application Auto Scaling API를 사용하여 MyVariant
(이)라는 이름의 모델에서 MyScalingPolicy
(이)라는 이름의 스케일링 정책을 삭제합니다.
POST / HTTP/1.1
Host: autoscaling.us-east-2.amazonaws.com
Accept-Encoding: identity
X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy
X-Amz-Date: 20160506T182145Z
User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8
Content-Type: application/x-amz-json-1.1
Authorization: AUTHPARAMS
{
"PolicyName": "MyScalingPolicy",
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/MyEndpoint/variant/MyVariant",
"ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency",
}
모델 등록 취소
AWS Management Console AWS CLI, 또는 Application Auto Scaling API를 사용하여 모델을 등록 취소할 수 있습니다.
모델 등록 취소(AWS CLI)
Application Auto Scaling에서 모델 등록을 취소하려면 다음 파라미터와 함께 deregister-scalable-target
AWS CLI; 명령을 사용하세요.
-
--resource-id
- 변형의 리소스 식별자. 이 파라미터에서 리소스 유형은endpoint
이고 고유 식별자는 변형의 이름입니다. 예:endpoint/MyEndpoint/variant/MyVariant
. -
--service-namespace
- 이 값을sagemaker
로 설정하세요. -
--scalable-dimension
- 이 값을sagemaker:variant:DesiredProvisionedConcurrency
로 설정하세요.
다음 예제에서는 Application Auto Scaling에서 MyVariant
(이)라는 이름의 모델에 대한 등록을 취소합니다.
aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
모델 등록 취소(Application Auto Scaling API)
Application Auto Scaling에서 모델의 등록을 취소하려면 다음 파라미터와 함께 DeregisterScalableTarget
Application Auto Scaling API 작업을 사용하세요.
-
ResourceId
- 변형의 리소스 식별자. 이 파라미터에서 리소스 유형은endpoint
이고 고유 식별자는 변형의 이름입니다. 예:endpoint/MyEndpoint/variant/MyVariant
. -
ServiceNamespace
- 이 값을sagemaker
로 설정하세요. -
ScalableDimension
- 이 값을sagemaker:variant:DesiredProvisionedConcurrency
로 설정하세요.
다음 예제에서는 Application Auto Scaling API를 사용하여 Application Auto Scaling에서 MyVariant
(이)라는 이름의 모델에 대한 등록을 취소합니다.
POST / HTTP/1.1
Host: autoscaling.us-east-2.amazonaws.com
Accept-Encoding: identity
X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget
X-Amz-Date: 20160506T182145Z
User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8
Content-Type: application/x-amz-json-1.1
Authorization: AUTHPARAMS
{
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/MyEndpoint/variant/MyVariant",
"ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency",
}
모델 등록 취소(AWS Management Console)
를 사용하여 모델(프로덕션 변형)의 등록을 취소하려면 AWS Management Console:
-
Amazon SageMaker AI 콘솔
을 엽니다. -
탐색 창에서 추론을 선택하세요.
-
엔드포인트 목록을 보려면 엔드포인트를 선택하세요.
-
프로덕션 변형을 호스팅할 서버리스 엔드포인트를 선택하세요. 엔드포인트의 설정이 표시되는 페이지가 나타나고, 엔드포인트 런타임 설정 섹션 아래에 프로덕션 변형이 나열되어 있습니다.
-
등록을 취소할 프로덕션 변형을 선택하고 Auto Scaling 구성을 선택하세요. 변형 자동 조정 구성 대화 상자가 나타납니다.
-
오토 스케일링 등록 취소를 선택합니다.