CatBoost 알고리즘에 대한 Amazon EC2 인스턴스 권장 사항 샘플 노트북

CatBoost

CatBoost는 그라데이션 부스팅 의사 결정 트리 알고리즘(GBDT)에서 널리 사용되는 고성능 오픈 소스 구현입니다. GBDT는 더욱 단순하고 약한 모델 세트의 추정치의 앙상블을 결합하여 대상 변수를 정확하게 예측하려 시도하는 지도 학습 알고리즘입니다.

CatBoost는 GBDT에 두 가지 중요한 알고리즘 고급 기능을 도입했습니다.

기존 알고리즘에 대한 순열 기반 대안인 순서가 있는 부스팅 구현
범주형 기능을 처리하기 위한 혁신적인 알고리즘

두 기법 모두 현재의 모든 기존 그라데이션 부스팅 알고리즘 구현에 존재하는 특수한 종류의 표적 누출로 인한 예측 변화를 막기 위해 개발되었습니다. 이 페이지에는 Amazon EC2 인스턴스 권장 사항 및 CatBoost용 샘플 노트북에 대한 정보가 포함되어 있습니다.

CatBoost 알고리즘에 대한 Amazon EC2 인스턴스 권장 사항

SageMaker AI CatBoost는 현재 CPUs. CatBoost는 메모리 바운드(컴퓨팅 바운드와는 반대) 알고리즘입니다. 따라서 컴퓨팅 최적화 인스턴스(예: C5)보다 범용 컴퓨팅 인스턴스(예: M5)를 선택하는 것이 좋습니다. 또한 훈련 데이터를 보유하기 위해 선택한 인스턴스에 총 메모리가 충분한 것이 좋습니다.

CatBoost 샘플 노트북

다음 표에는 Amazon SageMaker AI CatBoost 알고리즘의 다양한 사용 사례를 다루는 다양한 샘플 노트북이 요약되어 있습니다.

노트북 제목	설명
Amazon SageMaker AI LightGBM 및 CatBoost 알고리즘을 사용한 테이블 형식 분류	이 노트북은 Amazon SageMaker AI CatBoost 알고리즘을 사용하여 테이블 형식 분류 모델을 훈련하고 호스팅하는 방법을 보여줍니다.
Amazon SageMaker AI LightGBM 및 CatBoost 알고리즘을 사용한 테이블 형식 회귀	이 노트북은 Amazon SageMaker AI CatBoost 알고리즘을 사용하여 테이블 형식 회귀 모델을 훈련하고 호스팅하는 방법을 보여줍니다.

SageMaker AI에서 예제를 실행하는 데 사용할 수 있는 Jupyter 노트북 인스턴스를 생성하고 액세스하는 방법에 대한 지침은 섹션을 참조하세요Amazon SageMaker 노트북 인스턴스. 노트북 인스턴스를 생성하고 연 후 SageMaker AI 예제 탭을 선택하여 모든 SageMaker AI 샘플 목록을 확인합니다. 노트북을 열려면 사용 탭을 선택한 후 사본 생성을 선택합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

모델 튜닝

CatBoost 사용 방법