예제 노트북: Amazon SageMaker 오토파일럿을 사용한 모델링 살펴보기 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

예제 노트북: Amazon SageMaker 오토파일럿을 사용한 모델링 살펴보기

Amazon SageMaker 오토파일럿은 다음과 같은 예제 노트북을 제공합니다.

  • Amazon SageMaker Autopilot을 통한 다이렉트 마케팅: 이 노트북은 은행 마케팅 데이터 세트를 사용하여 고객이 은행에 정기 예금을 등록할지 여부를 예측하는 방법을 보여줍니다. 이 데이터 세트에서 Autopilot을 사용하여 다양한 후보 파이프라인에 포함된 옵션을 탐색하여 가장 정확한 ML 파이프라인을 얻을 수 있습니다. Autopilot은 2단계 절차를 통해 각 후보를 생성합니다. 첫 번째 단계에서는 데이터 세트에서 자동화된 기능 엔지니어링을 수행합니다. 두 번째 단계에서는 모델을 생성하기 위한 알고리즘을 훈련시키고 튜닝합니다. 노트북에는 모델을 훈련시키는 방법과 배치 추론을 수행하기 위해 최상의 후보를 사용하여 모델을 배포하는 방법에 대한 지침이 포함되어 있습니다.

  • Amazon SageMaker Autopilot을 통한 고객 이탈 예측: 이 노트북은 기계 학습을 사용하여 불만이 있는 고객을 자동으로 식별하는 방법 (고객 이탈 예측이라고도 함) 에 대해 설명합니다. 이 예제에서는 공개적으로 사용 가능한 데이터 세트를 분석하고 해당 데이터 세트에 대해 기능 엔지니어링을 수행하는 방법을 보여줍니다. 그 다음에는, 훈련 알고리즘에 대한 최적의 하이퍼파라미터와 함께 최고 성능의 파이프라인을 선택하여 모델을 튜닝하는 방법을 보여줍니다. 마지막으로, 호스팅된 엔드포인트에 모델을 배포하고 실측 정보에 대한 예측을 평가하는 방법을 보여줍니다. 그러나 ML 모델이 완벽한 예측을 제공하는 경우는 거의 없습니다. 이러한 이유로 이 노트북은 ML을 사용하여 재무 결과를 결정할 때 예측 실수의 상대 비용을 통합하는 방법도 보여줍니다.

  • 주요 후보: Amazon SageMaker Autopilot과 Batch Transform (Python SDK) 을 사용한 고객 이탈 예측: 이 노트북에서는 기계 학습을 사용하여 불만이 있는 고객을 자동으로 식별하는 방법 (고객 이탈 예측이라고도 함) 에 대해서도 설명합니다. 이 노트북은 추론 확률을 구하도록 모델을 구성하고, 상위 N개 모델을 선택하고, 평가를 위해 홀드아웃 테스트 세트에서 일괄 변환을 수행하는 방법을 보여줍니다.

    참고

    이 노트북은 2020년 6월 19일에 출시된 SageMaker Python SDK >= 1.65.1과 함께 작동합니다.

  • Amazon Autopilot으로 자체 데이터 처리 코드 가져오기: 이 노트북은 Amazon SageMaker Autopilot을 사용할 때 사용자 지정 데이터 처리 코드를 통합하고 배포하는 방법을 보여줍니다. SageMaker 사용자 지정 기능 선택 단계를 추가하여 Autopilot 작업에서 관련 없는 변수를 제거합니다. 그런 다음 Autopilot으로 생성된 사용자 지정 처리 코드와 모델을 실시간 엔드포인트에 배포하거나 일괄 처리를 위해 배포하는 방법을 보여줍니다.