데이터 플로우에서 모델 자동 훈련하기 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 플로우에서 모델 자동 훈련하기

Amazon SageMaker Autopilot을 사용하여 데이터 흐름에서 변환한 데이터에 대한 모델을 자동으로 훈련, 튜닝 및 배포할 수 있습니다. Amazon SageMaker Autopilot은 여러 알고리즘을 거쳐 데이터에 가장 적합한 알고리즘을 사용할 수 있습니다. Amazon SageMaker Autopilot에 대한 자세한 내용은 섹션을 참조하세요SageMaker Autopilot.

모델을 훈련하고 튜닝하면 Data Wrangler는 데이터를 Amazon Autopilot이 액세스할 수 있는 Amazon S3 위치로 내보냅니다. SageMaker

Data Wrangler 플로우에서 노드를 선택하고 데이터 미리 보기에서 내보내기 및 훈련을 선택하여 모델을 준비하고 배포할 수 있습니다. 모델을 훈련하기로 선택하기 전에 이 방법을 사용하여 데이터 세트를 확인할 수 있습니다.

데이터 플로우에서 직접 모델을 훈련하고 배포할 수도 있습니다.

다음 절차는 데이터 플로우에서 모델을 준비하고 배포합니다. 다중 행 변환이 포함된 Data Wrangler 플로우의 경우 모델을 배포할 때 Data Wrangler 플로우의 변환을 사용할 수 없습니다. 데이터를 사용하여 추론을 수행하기 전에 다음 절차를 사용하여 데이터를 처리할 수 있습니다.

데이터 플로우에서 직접 모델을 훈련하고 배포하려면 다음을 수행하세요.

  1. 훈련 데이터가 들어 있는 노드 옆의 +를 선택합니다.

  2. 모델 훈련을 선택합니다.

  3. (선택 사항) AWS KMS 키 또는 ID를 지정합니다. 데이터 보호를 위한 암호화 키 생성 및 제어에 대한 추가 정보는 AWS Key Management Service을 참고하세요.

  4. 내보내기 및 훈련을 선택합니다.

  5. Amazon SageMaker Autopilot이 Data Wrangler가 내보낸 데이터에 대해 모델을 훈련한 후 실험 이름 에 대한 이름을 지정합니다.

  6. 입력 데이터 에서 미리 보기를 선택하여 Data Wrangler가 데이터를 Amazon SageMaker Autopilot으로 올바르게 내보냈는지 확인합니다.

  7. 대상에서 대상 열을 선택합니다.

  8. (선택 사항) 출력 데이터에서 S3 위치 경우 기본 위치가 아닌 Amazon S3 위치를 지정합니다.

  9. 다음: 훈련 방법을 선택합니다.

  10. 훈련 방법을 선택합니다. 추가 정보는 훈련 모드 섹션을 참조하세요.

  11. (선택 사항) 자동 배포 엔드포인트의 경우 엔드포인트의 이름을 지정합니다.

  12. 배포 옵션에서 배포 방법을 선택합니다. 데이터에 수행한 변환과 함께 배포 또는 변환하지 않고 배포를 선택할 수 있습니다.

    중요

    Data Wrangler 흐름에서 수행한 변환을 사용하여 Amazon SageMaker Autopilot 모델을 배포할 수 없습니다. 이러한 변환에 대한 추가 정보는 추론 엔드포인트로 내보내기을 참고하세요.

  13. 다음: 검토 및 생성을 선택합니다.

  14. Create experiment(실험 생성)를 선택합니다.

모델 훈련 및 배포에 대한 추가 정보는 AutoML을 사용하여 테이블 형식 데이터에 대한 회귀 또는 분류 작업 생성 API을 참고하세요. Autopilot은 최적의 모델 성능에 대한 분석을 보여줍니다. 모델 성능에 대한 추가 정보는 Autopilot 모델 성능 보고서 보기을 참고하세요.