모델 배포 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

모델 배포

에서 JumpStart 모델을 배포하면 모델을 SageMaker 호스팅하고 추론에 사용할 수 있는 엔드포인트를 배포합니다. JumpStart 또한 모델을 배포한 후 모델에 액세스하는 데 사용할 수 있는 예제 노트북도 제공합니다.

중요

2023년 11월 30일부터 이전 아마존 SageMaker 스튜디오 익스피리언스는 이제 아마존 SageMaker 스튜디오 클래식으로 명명되었습니다. 다음 섹션은 스튜디오 클래식 애플리케이션 사용에 대한 내용입니다. 업데이트된 Studio 환경 사용에 대한 자세한 내용은 을 참조하십시오아마존 SageMaker 스튜디오.

참고

Studio에서의 JumpStart 모델 배포에 대한 자세한 내용은 을 참조하십시오. Studio에 기초 모델 배포하기

모델 배포 구성

모델을 선택하면 해당 모델의 탭이 열립니다. 모델 배포 창에서 배포 구성을 선택하여 모델 배포를 구성합니다.

The Deploy Model pane.

모델 배포를 위한 기본 인스턴스 유형은 모델에 따라 다릅니다. 인스턴스 유형은 훈련 작업이 실행되는 하드웨어입니다. 다음 예시에서는 이 특정 BERT 모델의 기본 ml.p2.xlarge 인스턴스가 됩니다.

또한 엔드포인트 이름을 변경하고, key;value 리소스 태그를 추가하고, 모델과 관련된 모든 JumpStart 리소스의 jumpstart- 접두사를 활성화 또는 비활성화하고, 엔드포인트에서 사용하는 모델 아티팩트를 저장하기 위한 Amazon S3 버킷을 지정할 수 있습니다. SageMaker

JumpStart Deploy Model pane with Deployment Configuration open to select its settings.

보안 설정을 선택하여 모델의 AWS Identity and Access Management (IAM) 역할, Amazon 가상 사설 클라우드 (AmazonVPC) 및 암호화 키를 지정합니다.

JumpStart Deploy Model pane with Security Settings open to select its settings.

모델 배포 보안

를 사용하여 JumpStart 모델을 배포할 때 모델의 IAM 역할VPC, Amazon 및 암호화 키를 지정할 수 있습니다. 이러한 항목에 값을 지정하지 않는 경우: 기본 IAM 역할은 Studio Classic 런타임 역할이고, 기본 암호화가 사용되며, VPC Amazon은 사용되지 않습니다.

IAM역할

교육 작업 및 호스팅 작업의 일부로 전달되는 IAM 역할을 선택할 수 있습니다. SageMaker 이 역할을 사용하여 교육 데이터 및 모델 아티팩트에 액세스합니다. 역할을 선택하지 않은 경우 Studio Classic 런타임 IAM 역할을 사용하여 모델을 SageMaker 배포합니다. IAM역할에 대한 자세한 내용은 을 참조하십시오Amazon용 ID 및 Access Management SageMaker.

전달하는 역할에는 모델에 필요한 리소스에 대한 액세스 권한이 있어야 하며 다음을 모두 포함해야 합니다.

참고

다음 각 역할에 부여된 Amazon S3 권한의 범위를 좁힐 수 있습니다. Amazon Simple Storage 서비스 (Amazon S3) 버킷과 JumpStart Amazon S3 버킷을 사용하여 이 작업을 수행할 수 있습니다. ARN

{ "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListMultipartUploadParts", "s3:ListBucket" ], "Resources": [ "arn:aws:s3:::jumpstart-cache-prod-<region>/*", "arn:aws:s3:::jumpstart-cache-prod-<region>", "arn:aws:s3:::bucket/*" ] }

IAM역할 찾기

이 옵션을 선택하는 경우 드롭다운 목록에서 기존 IAM 역할을 선택해야 합니다.

JumpStart Security Settings IAM section with Find IAM role selected.

역할 입력 IAM

이 옵션을 선택하는 경우 기존 IAM 역할에 ARN 대해 를 수동으로 입력해야 합니다. Studio Classic 런타임 역할 또는 Amazon에서 iam:list* 호출을 VPC 차단하는 경우 이 옵션을 사용하여 기존 IAM 역할을 사용해야 합니다.

JumpStart Security Settings IAM section with Input IAM role selected.

아마존 VPC

모든 JumpStart 모델은 네트워크 격리 모드에서 실행됩니다. 모델 컨테이너가 생성한 후에는 더 이상 호출할 수 없습니다. 교육 작업 및 호스팅 작업의 일부로 VPC 합격한 Amazon을 선택할 수 있습니다. SageMaker 이 VPC Amazon을 사용하여 Amazon S3 버킷에서 리소스를 푸시하고 가져옵니다. 이 VPC Amazon은 스튜디오 클래식 인스턴스의 퍼블릭 인터넷 액세스를 VPC 제한하는 Amazon과 다릅니다. 스튜디오 클래식 Amazon에 대한 자세한 내용은 VPC 을 참조하십시오a에 있는 Studio 노트북을 외부 VPC 리소스에 연결.

VPC통과한 Amazon은 공용 인터넷에 액세스할 필요가 없지만 Amazon S3에는 액세스할 수 있어야 합니다. Amazon S3용 Amazon VPC 엔드포인트는 모델에 필요한 최소한 다음 리소스에 대한 액세스를 허용해야 합니다.

{ "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListMultipartUploadParts", "s3:ListBucket" ], "Resources": [ "arn:aws:s3:::jumpstart-cache-prod-<region>/*", "arn:aws:s3:::jumpstart-cache-prod-<region>", "arn:aws:s3:::bucket/*" ] }

VPCAmazon을 선택하지 않으면 VPC Amazon이 사용되지 않습니다.

찾기 VPC

이 옵션을 선택하는 경우 드롭다운 목록에서 기존 VPC Amazon을 선택해야 합니다. VPCAmazon을 선택한 후에는 VPC Amazon의 서브넷 및 보안 그룹을 선택해야 합니다. 서브넷 및 보안 그룹에 대한 자세한 내용은 및 서브넷 VPCs개요를 참조하십시오.

JumpStart Security Settings VPC section with Find VPC selected.

입력 VPC

이 옵션을 선택하는 경우 Amazon을 구성하는 서브넷 및 보안 그룹을 수동으로 선택해야 합니다. VPC Studio Classic 런타임 역할 또는 Amazon에서 ec2:list* 호출을 VPC 차단하는 경우 이 옵션을 사용하여 서브넷 및 보안 그룹을 선택해야 합니다.

JumpStart Security Settings VPC section with Input VPC selected.

암호화 키

교육 작업 및 호스팅 작업의 일부로 전달되는 AWS KMS 키를 선택할 수 있습니다. SageMaker 이 키를 사용하여 컨테이너의 Amazon EBS 볼륨을 암호화하고 Amazon S3의 재패키징된 모델을 작업 호스팅용으로 암호화하고 교육 작업의 출력을 암호화합니다. 키에 대한 자세한 내용은 AWS KMS 키를 참조하십시오AWS KMS .

전달하는 키는 전달한 IAM 역할을 신뢰해야 합니다. IAM역할을 지정하지 않는 경우 AWS KMS 키는 Studio Classic 런타임 역할을 신뢰해야 합니다.

AWS KMS 키를 선택하지 않는 경우 Amazon EBS 볼륨 및 Amazon S3 아티팩트의 데이터에 대한 기본 암호화를 SageMaker 제공합니다.

암호화 키 찾기

이 옵션을 선택하는 경우 드롭다운 목록에서 기존 AWS KMS 키를 선택해야 합니다.

JumpStart Security Settings encryption section with Find encryption keys selected.

입력 암호화 키

이 옵션을 선택하는 경우 AWS KMS 키를 수동으로 입력해야 합니다. Studio Classic 실행 역할 또는 Amazon이 kms:list* 통화를 VPC 차단하는 경우 이 옵션을 사용하여 기존 AWS KMS 키를 선택해야 합니다.

JumpStart Security Settings encryption section with Input encryption keys selected.

JumpStart 모델의 기본값을 구성하십시오.

JumpStart 모델 배포 및 교육을 위해 IAM 역할VPCs, KMS 키 등의 매개변수에 대한 기본값을 구성하여 미리 채울 수 있습니다. 기본값을 구성한 후 Studio Classic UI는 지정된 보안 설정과 태그를 JumpStart 모델에 자동으로 제공하여 배포 및 교육 워크플로를 단순화합니다. 관리자와 최종 사용자는 구성 파일에 지정된 기본값을 형식으로 초기화할 수 있습니다. YAML

기본적으로 SageMaker SDK Python은 두 개의 구성 파일을 사용합니다. 하나는 관리자용이고 다른 하나는 사용자용입니다. 관리자는 관리자 구성 파일을 사용하여 기본값 세트를 정의할 수 있습니다. 최종 사용자는 관리자 구성 파일에 설정된 값을 재정의하고 최종 사용자 구성 파일을 사용하여 추가 기본값을 설정할 수 있습니다. (자세한 정보는 기본 구성 파일 위치를 참조하세요.

다음 코드 샘플은 Amazon SageMaker Studio SDK Classic에서 SageMaker Python을 사용할 때 구성 파일의 기본 위치를 나열합니다.

# Location of the admin config file /etc/xdg/sagemaker/config.yaml # Location of the user config file /root/.config/sagemaker/config.yaml

사용자 구성 파일에 지정된 값은 관리자 구성 파일에 설정된 값보다 우선합니다. 구성 파일은 Amazon SageMaker 도메인 내의 각 사용자 프로필마다 고유합니다. 사용자 프로필의 Studio Classic 애플리케이션은 사용자 프로필과 직접 연결됩니다. 자세한 내용은 도메인 사용자 프로필 단원을 참조하십시오.

관리자는 JupyterServer 라이프사이클 구성을 통해 JumpStart 모델 교육 및 배포를 위한 구성 기본값을 선택적으로 설정할 수 있습니다. 자세한 내용은 수명 주기 구성 생성 및 연결 단원을 참조하십시오.

구성 파일은 SageMaker Python SDK 구성 파일 구조를 준수해야 합니다. TrainingJob,Model, 및 EndpointConfig 구성의 특정 필드는 JumpStart 모델 교육 및 배포 기본값에 적용된다는 점에 유의하십시오.

SchemaVersion: '1.0' SageMaker: TrainingJob: OutputDataConfig: KmsKeyId: example-key-id ResourceConfig: # Training configuration - Volume encryption key VolumeKmsKeyId: example-key-id # Training configuration form - IAM role RoleArn: arn:aws:iam::123456789012:role/SageMakerExecutionRole VpcConfig: # Training configuration - Security groups SecurityGroupIds: - sg-1 - sg-2 # Training configuration - Subnets Subnets: - subnet-1 - subnet-2 # Training configuration - Custom resource tags Tags: - Key: Example-key Value: Example-value Model: EnableNetworkIsolation: true # Deployment configuration - IAM role ExecutionRoleArn: arn:aws:iam::123456789012:role/SageMakerExecutionRole VpcConfig: # Deployment configuration - Security groups SecurityGroupIds: - sg-1 - sg-2 # Deployment configuration - Subnets Subnets: - subnet-1 - subnet-2 EndpointConfig: AsyncInferenceConfig: OutputConfig: KmsKeyId: example-key-id DataCaptureConfig: # Deployment configuration - Volume encryption key KmsKeyId: example-key-id KmsKeyId: example-key-id # Deployment configuration - Custom resource tags Tags: - Key: Example-key Value: Example-value