기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
LDA 하이퍼파라미터
CreateTrainingJob
요청에서 훈련 알고리즘을 지정합니다. 알고리즘별 하이퍼파라미터를 맵으로 지정할 수도 있습니다. string-to-string 다음 표에는 Amazon에서 제공하는 LDA 교육 알고리즘의 하이퍼파라미터가 나열되어 있습니다. SageMaker 자세한 정보는 LDA 작동 방식을 참조하세요.
파라미터 이름 | 설명 |
---|---|
num_topics |
데이터 내에서 찾을 LDA에 대한 주제 수. 필수 유효한 값: 양수 |
feature_dim |
입력 문서 코퍼스의 어휘 크기. 필수 유효한 값: 양수 |
mini_batch_size |
입력 문서 코퍼스의 전체 문서 수. 필수 유효한 값: 양수 |
alpha0 |
집중 파라미터에 대한 초기 추측: 디리클레 사전 요소의 합. 값이 작으면 희소 주제 혼합을 생성할 가능성이 높고, 값이 높으면(1.0보다 큼) 더욱 균일한 조합을 생성합니다. 선택 사항 유효한 값: 양의 부동 소수점 기본값: 1.0 |
max_restarts |
알고리즘의 Alternating Least Squares(ALS) 스펙트럼 분해 단계 도중 수행하는 재시작 횟수. 추가 컴퓨팅을 대가로 품질이 더욱 뛰어난 국부 최솟값을 찾는 데 사용될 수 있지만 일반적으로 조정될 수 없습니다. 선택 사항 유효한 값: 양수 기본값: 10 |
max_iterations |
알고리즘의 ALS 단계 도중 수행하는 최대 반복 횟수. 추가 컴퓨팅을 대가로 품질이 더욱 뛰어난 최솟값을 찾는 데 사용될 수 있지만 일반적으로 조정될 수 없습니다. 선택 사항 유효한 값: 양수 기본값: 1000 |
tol |
알고리즘의 ALS 단계에 대한 대상 오차 허용성. 추가 컴퓨팅을 대가로 품질이 더욱 뛰어난 최솟값을 찾는 데 사용될 수 있지만 일반적으로 조정될 수 없습니다. 선택 사항 유효한 값: 양의 부동 소수점 기본값: 1e-8 |