LDA 하이퍼파라미터 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

LDA 하이퍼파라미터

CreateTrainingJob 요청에서 훈련 알고리즘을 지정합니다. 알고리즘별 하이퍼파라미터를 문자열-문자열 맵으로 지정할 수 있습니다. 다음 표에는 Amazon SageMaker SageMaker에서 제공되는 LDA 훈련 알고리즘에 대한 하이퍼파라미터가 나열되어 있습니다. 자세한 정보는 LDA 작동 방식을 참조하십시오.

파라미터 이름 설명
num_topics

데이터 내에서 찾을 LDA에 대한 주제 수.

필수

유효한 값: 양수

feature_dim

입력 문서 코퍼스의 어휘 크기.

필수

유효한 값: 양수

mini_batch_size

입력 문서 코퍼스의 전체 문서 수.

필수

유효한 값: 양수

alpha0

집중 파라미터에 대한 초기 추측: 디리클레 사전 요소의 합. 값이 작으면 희소 주제 혼합을 생성할 가능성이 높고, 값이 높으면(1.0보다 큼) 더욱 균일한 조합을 생성합니다.

선택

유효한 값: 포지티브 부동

기본값: 1.0

max_restarts

알고리즘의 Alternating Least Squares(ALS) 스펙트럼 분해 단계 도중 수행하는 재시작 횟수. 추가 컴퓨팅을 대가로 품질이 더욱 뛰어난 국부 최솟값을 찾는 데 사용될 수 있지만 일반적으로 조정될 수 없습니다.

선택

유효한 값: 양의 정수

기본값: 10

max_iterations

알고리즘의 ALS 단계 도중 수행하는 최대 반복 횟수. 추가 컴퓨팅을 대가로 품질이 더욱 뛰어난 최솟값을 찾는 데 사용될 수 있지만 일반적으로 조정될 수 없습니다.

선택

유효한 값: 양의 정수

기본값: 1000

tol

알고리즘의 ALS 단계에 대한 대상 오차 허용성. 추가 컴퓨팅을 대가로 품질이 더욱 뛰어난 최솟값을 찾는 데 사용될 수 있지만 일반적으로 조정될 수 없습니다.

선택

유효한 값: 포지티브 부동

기본값: 1e-8