데이터 플로우에서 모델 자동 훈련하기

Amazon SageMaker Autopilot을 사용하면 데이터 플로우에서 변환한 데이터를 기반으로 모델을 자동으로 훈련, 조정 및 배포할 수 있습니다. Amazon SageMaker Autopilot은 여러 알고리즘을 거쳐 데이터에 가장 적합한 알고리즘을 사용할 수 있습니다. Amazon SageMaker Autopilot에 대한 추가 정보는 SageMaker Autopilot를 참고하세요.

모델을 훈련하고 조정할 때 Data Wrangler는 Amazon SageMaker Autopilot이 데이터에 액세스할 수 있는 Amazon S3 위치로 데이터를 내보냅니다.

Data Wrangler 플로우에서 노드를 선택하고 데이터 미리 보기에서 내보내기 및 훈련을 선택하여 모델을 준비하고 배포할 수 있습니다. 모델을 훈련하기로 선택하기 전에 이 방법을 사용하여 데이터세트를 확인할 수 있습니다.

데이터 플로우에서 직접 모델을 훈련하고 배포할 수도 있습니다.

다음 절차는 데이터 플로우에서 모델을 준비하고 배포합니다. 다중 행 변환이 포함된 Data Wrangler 플로우의 경우 모델을 배포할 때 Data Wrangler 플로우의 변환을 사용할 수 없습니다. 데이터를 사용하여 추론을 수행하기 전에 다음 절차를 사용하여 데이터를 처리할 수 있습니다.

데이터 플로우에서 직접 모델을 훈련하고 배포하려면 다음을 수행하세요.

훈련 데이터가 들어 있는 노드 옆의 +를 선택합니다.
모델 훈련을 선택합니다.
(선택 사항) AWS KMS 키 또는 ID를 지정합니다. 데이터 보호를 위한 암호화 키 생성 및 제어에 대한 추가 정보는 AWS Key Management Service을 참고하세요.
내보내기 및 훈련을 선택합니다.
Amazon SageMaker Autopilot은 Data Wrangler가 내보낸 데이터를 기반으로 모델을 훈련시킨 후 실험 이름에 이름을 지정합니다.
데이터 입력에서 미리보기를 선택하여 Data Wrangler가 데이터를 Amazon SageMaker Autopilot으로 제대로 내보냈는지 확인합니다.
대상에서 대상 열을 선택합니다.
(선택 사항) 출력 데이터에서 S3 위치 경우 기본 위치가 아닌 Amazon S3 위치를 지정합니다.
다음: 훈련 방법을 선택합니다.
훈련 방법을 선택합니다. 추가 정보는 훈련 모드 섹션을 참조하세요.
(선택 사항) 자동 배포 엔드포인트의 경우 엔드포인트의 이름을 지정합니다.
배포 옵션에서 배포 방법을 선택합니다. 데이터에 수행한 변환과 함께 배포 또는 변환하지 않고 배포를 선택할 수 있습니다.

중요
Data Wrangler 플로우에서 수행한 변환과 함께 Amazon SageMaker Autopilot 모델을 배포할 수는 없습니다. 이러한 변환에 대한 추가 정보는 추론 엔드포인트로 내보내기을 참고하세요.
다음: 검토 및 생성을 선택합니다.
Create experiment(실험 생성)를 선택합니다.

모델 훈련 및 배포에 대한 추가 정보는 AutoML API를 사용하여 테이블 형식 데이터에 대한 회귀 또는 분류 작업 생성을 참고하세요. Autopilot은 최적의 모델 성능에 대한 분석을 보여줍니다. 모델 성능에 대한 추가 정보는 Autopilot 모델 성능 보고서 보기을 참고하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

데이터 및 데이터 품질에 대한 인사이트 확보

데이터 변환하기

데이터 플로우에서 모델 자동 훈련하기

중요