Factorization Machine 알고리즘 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Factorization Machine 알고리즘

인수 분해 기계 알고리즘은 분류 및 회귀 작업 모두에 사용할 수 있는 범용 지도 학습 알고리즘입니다. 고차원 희소 데이터 세트 내 특징 간 상호 작용을 경제적으로 캡처하도록 설계된 선형 모델의 확장입니다. 예를 들어 클릭 예측 시스템에서 인수 분해 기계 모델은 특정 광고 카테고리의 광고가 특정 페이지 카테고리의 페이지에 게재될 때 관찰되는 클릭률 패턴을 캡처할 수 있습니다. Factorization Machine은 클릭 예측 및 품목 추천과 같은 고차원 희소 데이터 세트를 처리하는 작업에 있어 좋은 선택합니다.

참고

Amazon SageMaker 인수 분해 기계 알고리즘을 구현하면 특징 간의 쌍별 (2차) 상호 작용만 고려합니다.

Factorization Machines 알고리즘의 입력/출력 인터페이스

인수 분해 기계 알고리즘은 이진 분류 모드 또는 회귀 모드에서 실행할 수 있습니다. 각 모드에서 데이터 세트는 교육 채널 데이터 세트와 함께 테스트 채널로 제공될 수 있습니다. 점수 계산은 사용하는 모드에 따라 달라집니다. 회귀 모드에서 테스팅 데이터 세트는 평균 제곱근 오차(RMSE)를 사용하여 점수가 매겨집니다. 이진 분류 모드에서 테스트 데이터 세트는 이진 교차 엔트로피(로그 손실), 정확성(임계치 = 0.5) 및 F1 점수(임계치 = 0.5)를 사용하여 점수가 매겨집니다.

에 대한훈련, 인수 분해 기계 알고리즘은 현재recordIO-protobuf형식Float32텐서. 사용 사례가 주로 희소 데이터이기 때문에 CSV는 좋은 선택이 아닙니다. 파일 및 파이프 모드 훈련 둘 다 recordIO-wrapped protobuf에 대해 지원됩니다.

에 대한추론, 인수 분해 기계 알고리즘은application/jsonx-recordio-protobuf형식

  • 이진 분류 문제의 경우 알고리즘은 점수와 레이블을 예측합니다. 레이블은 숫자이고 0 또는 1일 수 있습니다. 점수는 알고리즘이 레이블이 1일 것이라고 판단하는 강도를 나타내는 숫자입니다. 알고리즘은 먼저 점수를 계산한 후 점수 값에서 레이블을 도출합니다. 점수가 0.5 이상이면 레이블은 1입니다.

  • 회귀 문제의 경우 점수만 반환되며 이것은 예측된 값입니다. 예를 들어 Factorization Machines을 사용하여 영화 평점을 예측하는 경우 점수는 에측된 평점 값입니다.

훈련 및 추론 파일 형식에 대한 자세한 정보는 Factorization Machines 샘플 노트북 단원을 참조하십시오.

Factorization Machines 알고리즘에 대한 EC2 인스턴스 권장 사항

Amazon SageMaker 팩토라이제이션 머신 알고리즘은 확장성이 뛰어나며 분산 인스턴스 간에 트레이닝할 희소 및 밀집 데이터 세트에 대해 CPU 인스턴스를 사용한 교육 및 추론을 권장합니다. 일부 환경의 경우 밀집 데이터에서 하나 이상의 GPU를 사용한 교육은 약간의 이점을 제공할 수 있습니다. GPU를 사용한 교육은 밀집 데이터에서만 가능합니다. 희소 데이터에 대해 CPU 인스턴스를 사용하십시오. 인수 분해 기계 알고리즘은 학습 및 추론을 위해 P2, P3, G4dn 및 G5 인스턴스를 지원합니다.

Factorization Machines 샘플 노트북

를 사용하는 샘플 노트북의 경우 SageMaker MNIST 데이터셋에서 0부터 9까지의 손글씨 숫자 이미지를 분석하는 인수 분해 기계 알고리즘은 다음을 참조하십시오.MNIST를 사용한 인수 분해 기계 소개. SageMaker에서 예제 실행에 사용할 수 있는 Jupyter 노트북 인스턴스를 생생하고 이 인스턴스에 액세스하는 방법은 Amazon SageMaker 노트북 인스턴스 사용 단원을 참조하십시오. 노트북 인스턴스를 만들고 연 다음SageMaker 예제:탭을 클릭하면 모든 목록이 표시됩니다. SageMaker 샘플. 인수 분해 기계 알고리즘을 사용하는 예제 노트북은 다음 위치에 있습니다.Amazon 알고리즘 소개섹션. 노트북을 열려면 사용 탭을 클릭하고 Create copy(사본 생성)를 선택합니다.