기본 제공 SageMaker 테이블 형식 데이터 알고리즘 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기본 제공 SageMaker 테이블 형식 데이터 알고리즘

아마존 SageMaker 테이블 형식 데이터 분석에 맞게 조정된 내장 알고리즘을 제공합니다. 기본 제공 SageMaker 테이블 형식 데이터 알고리즘은 분류 또는 회귀 문제에 사용할 수 있습니다.

  • AutoGluon-테이블 형식—모델을 조합하고 여러 레이어로 스태킹하여 성공하는 오픈 소스 AutoML 프레임워크입니다.

  • CatBoost—범주형 특징을 처리하기 위한 혁신적인 알고리즘과 순서가 지정된 부스팅을 도입한 그래디언트 부스트 트리 알고리즘의 구현입니다.

  • Factorization Machine 알고리즘—고차원 희소 데이터 세트 내에서 특징 간의 상호 작용을 경제적으로 캡처하도록 설계된 선형 모델의 확장입니다.

  • K-Nearest Neighbors(k-NN) 알고리즘— 가장 가까운 레이블이 지정된 k개의 점을 사용하여 분류할 새 데이터 요소에 레이블을 할당하거나 회귀 분석을 위해 가장 가까운 k개 점의 평균에서 예측된 목표값을 지정하는 비모수 방법입니다.

  • 라이트 GBM—효율성 및 확장성 향상을 위한 두 가지 새로운 기술을 추가하는 그래디언트 부스티드 트리 알고리즘 구현: 그래디언트 기반 단면 샘플링 (GOSS) 및 독점 기능 번들링 (EFB).

  • 선형 학습자 알고리즘—회귀 분석을 위한 선형 함수 또는 분류를 위한 선형 임계값 함수를 학습합니다.

  • TabTransformer—새로운 딥테이블 형식 데이터 모델링 아키텍처를 기반으로 구축되었습니다. self-attention-basedTransform.

  • XGBoost 알고리즘—더 단순하고 약한 모델 세트의 추정치 집합을 결합한 그래디언트 부스티드 트리 알고리즘의 구현입니다.

알고리즘 이름 채널 이름 훈련 입력 모드 파일 유형 인스턴스 클래스 병렬화 가능
AutoGluon-테이블 형식 교육 및 (선택 사항) 검증 파일 CSV CPU 또는 GPU (단일 인스턴스만 해당) 아니요
CatBoost 교육 및 (선택 사항) 검증 파일 CSV CPU(단일 인스턴스 전용) 아니요
Factorization Machines train 및 (선택 사항) test 파일 또는 파이프 recordIO-protobuf CPU(밀집 데이터의 경우 GPU)
k-Neighbor (k-NN) train 및 (선택 사항) test 파일 또는 파이프 recordIO-protobuf 또는 CSV CPU 또는 GPU(하나 이상의 인스턴스에 대한 단일 GPU 디바이스)
라이트 GBM 교육 및 (선택 사항) 검증 파일 CSV CPU(단일 인스턴스 전용) 아니요
Linear Learner train 및 (선택 사항) validation, test 또는 모두 파일 또는 파이프 recordIO-protobuf 또는 CSV CPU 또는 GPU
TabTransformer 교육 및 (선택 사항) 검증 파일 CSV CPU 또는 GPU (단일 인스턴스만 해당) 아니요
엑스지부스트 (0.90-1, 0.90-2, 1.0-1, 1.2-1, 1.2-21) train 및 (선택 사항) validation 파일 또는 파이프 CSV, LibSVM 또는 파케트 CPU (또는 1.2-1을 위한 GPU)