쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

정리

포커스 모드
정리 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

프로비저닝된 동시성을 사용하여 서버리스 엔드포인트에 대한 자동 크기 조정 사용을 완료한 후에는 생성한 리소스를 정리해야 합니다. 여기에는 조정 정책을 삭제하고 Application Auto Scaling에서 모델을 등록 취소하는 작업이 포함됩니다. 정리하면 더 이상 사용하지 않는 리소스에 불필요한 비용이 발생하지 않습니다.

스케일링 정책 삭제

AWS Management Console, AWS CLI또는 Application Auto Scaling API를 사용하여 조정 정책을 삭제할 수 있습니다. 를 사용하여 조정 정책을 삭제하는 방법에 대한 자세한 내용은 SageMaker AI Autoscaling 설명서스케일링 정책 삭제의 섹션을 AWS Management Console참조하세요.

스케일링 정책 삭제(AWS CLI)

모델에 스케일링 정책을 적용하려면 다음 파라미터와 함께 delete-scaling-policy AWS CLI; 명령을 사용하세요.

  • --policy-name – 조정 정책의 이름입니다.

  • --resource-id - 변형의 리소스 식별자. 이 파라미터에서 리소스 유형은 endpoint이고 고유 식별자는 변형의 이름입니다. 예: endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace - 이 값을 sagemaker로 설정하세요.

  • --scalable-dimension - 이 값을 sagemaker:variant:DesiredProvisionedConcurrency로 설정하세요.

다음 예제에서는 MyVariant(이)라는 이름의 모델에서 MyScalingPolicy(이)라는 이름의 스케일링 정책을 삭제합니다.

aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

스케일링 정책 삭제(Application Auto Scaling API)

모델에서 스케일링 정책을 삭제하려면 다음 파라미터와 함께 DeleteScalingPolicy Application Auto Scaling API 작업을 사용하세요.

  • PolicyName – 조정 정책의 이름입니다.

  • ResourceId - 변형의 리소스 식별자. 이 파라미터에서 리소스 유형은 endpoint이고 고유 식별자는 변형의 이름입니다. 예: endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace - 이 값을 sagemaker로 설정하세요.

  • ScalableDimension - 이 값을 sagemaker:variant:DesiredProvisionedConcurrency로 설정하세요.

다음 예제에서는 Application Auto Scaling API를 사용하여 MyVariant(이)라는 이름의 모델에서 MyScalingPolicy(이)라는 이름의 스케일링 정책을 삭제합니다.

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

모델 등록 취소

AWS Management Console AWS CLI, 또는 Application Auto Scaling API를 사용하여 모델을 등록 취소할 수 있습니다.

모델 등록 취소(AWS CLI)

Application Auto Scaling에서 모델 등록을 취소하려면 다음 파라미터와 함께 deregister-scalable-target AWS CLI; 명령을 사용하세요.

  • --resource-id - 변형의 리소스 식별자. 이 파라미터에서 리소스 유형은 endpoint이고 고유 식별자는 변형의 이름입니다. 예: endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace - 이 값을 sagemaker로 설정하세요.

  • --scalable-dimension - 이 값을 sagemaker:variant:DesiredProvisionedConcurrency로 설정하세요.

다음 예제에서는 Application Auto Scaling에서 MyVariant(이)라는 이름의 모델에 대한 등록을 취소합니다.

aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

모델 등록 취소(Application Auto Scaling API)

Application Auto Scaling에서 모델의 등록을 취소하려면 다음 파라미터와 함께 DeregisterScalableTarget Application Auto Scaling API 작업을 사용하세요.

  • ResourceId - 변형의 리소스 식별자. 이 파라미터에서 리소스 유형은 endpoint이고 고유 식별자는 변형의 이름입니다. 예: endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace - 이 값을 sagemaker로 설정하세요.

  • ScalableDimension - 이 값을 sagemaker:variant:DesiredProvisionedConcurrency로 설정하세요.

다음 예제에서는 Application Auto Scaling API를 사용하여 Application Auto Scaling에서 MyVariant(이)라는 이름의 모델에 대한 등록을 취소합니다.

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

모델 등록 취소(AWS Management Console)

를 사용하여 모델(프로덕션 변형)의 등록을 취소하려면 AWS Management Console:

  1. Amazon SageMaker AI 콘솔을 엽니다.

  2. 탐색 창에서 추론을 선택하세요.

  3. 엔드포인트 목록을 보려면 엔드포인트를 선택하세요.

  4. 프로덕션 변형을 호스팅할 서버리스 엔드포인트를 선택하세요. 엔드포인트의 설정이 표시되는 페이지가 나타나고, 엔드포인트 런타임 설정 섹션 아래에 프로덕션 변형이 나열되어 있습니다.

  5. 등록을 취소할 프로덕션 변형을 선택하고 Auto Scaling 구성을 선택하세요. 변형 자동 조정 구성 대화 상자가 나타납니다.

  6. 오토 스케일링 등록 취소를 선택합니다.

프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.