Amazon SageMaker Studio를 사용하여 JumpStart에서 모델 배포 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon SageMaker Studio를 사용하여 JumpStart에서 모델 배포

다음 단계에서는 Amazon SageMaker Studio를 사용하여 JumpStart에서 모델을 배포하는 방법을 보여줍니다.

사전 조건

Amazon SageMaker HyperPod 클러스터에서 추론 기능을 설정했는지 확인합니다. 자세한 내용은 모델 배포를 위한 HyperPod 클러스터 설정 단원을 참조하십시오.

HyperPod 배포 생성

  1. Amazon SageMaker Studio의 왼쪽 탐색 창에서 JumpStart 랜딩 페이지를 엽니다.

  2. 모든 퍼블릭 모델에서 배포하려는 모델을 선택합니다.

    참고

    게이트 모델을 선택한 경우 최종 사용자 라이선스 계약(EULA)에 동의해야 합니다.

  3. SageMaker HyperPod를 선택합니다.

  4. 배포 설정에서 JumpStart는 배포를 위해 인스턴스를 추천합니다. 필요한 경우 이러한 설정을 수정할 수 있습니다.

    1. 인스턴스 유형을 수정하는 경우 선택한 HyperPod 클러스터와 호환되는지 확인합니다. 호환되는 인스턴스가 없는 경우 새 HyperPod 클러스터를 선택하거나 관리자에게 문의하여 클러스터에 호환되는 인스턴스를 추가해야 합니다.

    2. 모델 배포의 우선 순위를 지정하려면 작업 거버넌스 추가 기능을 설치하고, 컴퓨팅 할당을 생성하고, 클러스터 정책에 대한 작업 순위를 설정합니다. 이 작업이 완료되면 클러스터에서 다른 배포 및 작업을 선점하는 데 사용할 수 있는 모델 배포의 우선 순위를 선택하는 옵션이 표시됩니다.

    3. 관리자가 액세스 권한을 제공한 네임스페이스를 입력합니다. 정확한 네임스페이스를 얻으려면 관리자에게 직접 문의해야 할 수 있습니다. 유효한 네임스페이스가 제공되면 모델을 배포하려면 배포 버튼을 활성화해야 합니다.

  5. 배포를 선택하고 엔드포인트가 생성될 때까지 기다립니다.

  6. 엔드포인트를 생성한 후 추론 테스트를 선택합니다.

HyperPod 배포 편집

  1. Amazon SageMaker Studio의 왼쪽 탐색 창에서 컴퓨팅을 선택한 다음 HyperPod 클러스터를 선택합니다.

  2. 배포에서 수정하려는 HyperPod 클러스터 배포를 선택합니다.

  3. 세로 줄임표 아이콘(")에서 편집을 선택합니다.

  4. 배포 설정에서 Auto Scaling을 활성화 또는 비활성화하고 최대 복제본 수를 변경할 수 있습니다.

  5. 저장을 선택합니다.

  6. 상태가 업데이트 중으로 변경됩니다. 서비스 중으로 다시 변경되면 변경 사항이 완료되고 확인 메시지가 표시됩니다.

HyperPod 배포 삭제

  1. Amazon SageMaker Studio의 왼쪽 탐색 창에서 컴퓨팅을 선택한 다음 HyperPod 클러스터를 선택합니다.

  2. 배포에서 수정하려는 HyperPod 클러스터 배포를 선택합니다.

  3. 세로 줄임표 아이콘(")에서 삭제를 선택합니다.

  4. HyperPod 배포 삭제 창에서 확인란을 선택합니다.

  5. 삭제를 선택합니다.

  6. 상태가 삭제 중으로 변경됩니다. HyperPod 배포가 삭제되면 이를 확인하는 메시지가 표시됩니다.