모범 사례 -

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

모범 사례

이 섹션에서는 MLOps의 AWS 모범 사례에 대한 개요를 제공합니다.

계정 관리 및 분리

계정 관리 AWS 모범 사례에서는 각 사용 사례에 대해 계정을 실험, 개발, 테스트 및 생산이라는 네 개의 계정으로 나누는 것이 좋습니다. 또한 조직 전체에 공유 MLOps 리소스를 제공하기 위한 거버넌스 계정과 중앙 집중식 데이터 액세스를 제공하기 위한 데이터 레이크 계정을 보유하는 것이 좋습니다. 이에 대한 논리적 근거는 개발, 테스트 및 프로덕션 환경을 완전히 분리하고, 동일한 계정 세트를 공유하는 여러 사용 사례 및 데이터 과학 팀을 통해 서비스 제한에 도달하여 발생하는 지연을 방지하고, 각 사용 사례 비용의 전체 개요를 제공하는 것입니다. 마지막으로, 사용 사례마다 고유한 계정 세트가 있으므로 계정 수준 데이터를 분리하는 것이 좋습니다.

보안 표준

보안 요구 사항을 충족하려면 퍼블릭 인터넷 액세스를 끄고 사용자 지정 키로 모든 데이터를 암호화하는 것이 좋습니다. 그런 다음 Service Catalog를 사용하여 몇 분 만에 Amazon SageMaker AI Studio의 보안 인스턴스를 개발 계정에 배포할 수 있습니다. SageMaker AI 프로젝트와 함께 배포된 템플릿을 통해 SageMaker AI를 사용하여 각 사용 사례에 대한 감사 및 모델 모니터링 기능을 얻을 수도 있습니다.

사용 사례 기능

계정 설정이 완료되면 조직의 데이터 과학자는 SageMaker AI Studio에서 SageMaker SageMaker AI 프로젝트를 사용하여 새 사용 사례 템플릿을 요청할 수 있습니다. 이 프로세스는 CI/CD 파이프라인, 단위 테스트, 모델 테스트, 모델 모니터링 등의 MLOps 기능을 개발 계정에 포함시키는 데 필요한 인프라를 배포합니다(중앙 팀에서 필요한 최소한의 지원 포함).

그런 다음 실험 추적, 모델 설명 가능성, 편향 감지, 데이터/모델 품질 모니터링과 같은 SageMaker AI 기능을 사용하여 SageMaker AI 아키텍처에서 실행되도록 각 사용 사례를 개발(또는 기존 애플리케이션 코드 베이스의 경우 리팩터링)합니다. SageMaker AI 파이프라인의 파이프라인 단계를 사용하여 각 사용 사례 파이프라인에 이러한 기능을 추가할 수 있습니다.

MLOps 성숙도 여정

MLOps 성숙도 여정은 엔드 투 엔드 모델 워크플로가 마련되어 있는지 확인하기 위해 전사적 설정에서 사용할 수 있는 필수 MLOps 기능을 정의합니다. 성숙도 여정은 4단계로 구성됩니다.

  1. 초기 – 이 단계에서는 실험 계정을 설정하고, 또한 조직 내에서 SageMaker Studio 및 기타 새로운 AWS 서비스를 실험할 수 있는 새 AWS 계정을 보호할 수 있습니다.

  2. 반복 가능 - 이 단계에서는 코드 리포지토리와 ML 솔루션 개발을 표준화합니다. 또한 다중 계정 구현 접근 방식을 채택하고, 제품을 스케일 아웃할 때 모델 거버넌스와 모델 감사를 지원하도록 코드 리포지토리를 표준화합니다. 거버넌스 계정에서 제공하는 표준 솔루션을 사용하여 프로덕션에 즉시 사용 가능한 모델 개발 접근 방식을 채택하는 것이 가장 좋습니다. 데이터는 데이터 레이크 계정에 저장되며 사용 사례는 두 계정에서 개발됩니다. 첫 번째 계정은 데이터 과학 탐구 기간 동안의 실험용입니다. 이 계정에서 데이터 사이언티스트는 비즈니스 문제를 해결하기 위한 모델을 검색하고 다양한 가능성을 실험합니다. 또 다른 계정은 최상의 모델이 식별되고 데이터 과학 팀이 추론 파이프라인에서 작업할 준비가 된 후에 진행되는 개발용입니다.

  3. 안정성 - 이 단계에서는 테스트, 배포, 다중 계정 배포를 소개합니다. MLOps 요구 사항을 이해하고 자동 테스트를 도입해야 합니다. MLOps 모범 사례를 구현하여 두 모델 모두 강력하고 안전한지 확인하세요. 이 단계에서 2개의 새로운 사용 사례 계정을 소개합니다. 하나는 프로덕션 환경을 에뮬레이션하는 환경에서 개발된 모델을 테스트하기 위한 테스트 계정이고 다른 하나는 비즈니스 운영 중에 모델 추론을 실행하기 위한 프로덕션 계정입니다. 마지막으로, 다중 계정 설정에서 자동 모델 테스트, 배포 및 모니터링을 사용하여 모델이 설정한 고품질 및 성능 기준을 충족하는지 확인하세요.

  4. 확장성 - 이 단계에서는 여러 ML 솔루션을 템플릿화하고 프로덕션화합니다. 여러 팀과 ML 사용 사례가 엔드 투 엔드 모델 구축 프로세스 중에 MLOps를 채택하기 시작합니다. 또한 이 단계에서 확장성을 확보하고자 광범위한 데이터 사이언티스트의 기여를 통해 템플릿 라이브러리의 템플릿 수를 늘리고, 조직 전체의 더 많은 팀을 위해 아이디어에서 프로덕션 모델까지 가치 실현 시간을 단축하고, 확장에 따라 반복합니다.

MLOps 성숙도 모델에 대한 자세한 내용은 AWS Machine Learning 블로그의 Amazon SageMaker AI를 사용하는 기업을 위한 MLOps 파운데이션 로드맵을 참조하세요.