NTM 하이퍼파라미터 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

NTM 하이퍼파라미터

파라미터 이름 설명

feature_dim

데이터 세트의 어휘 크기.

필수

유효한 값: 양의 정수 (최소: 1, 최대 1,000,000)

num_topics

필수 주제의 수.

필수

유효한 값: 양의 정수 (최소: 2, 최대 1000)

batch_norm

교육 도중 배치 정규화 사용 여부.

선택

유효한 값: true 또는 false

기본값: false

clip_gradient

각 그라디언트 구성 요소에 대한 최대 크기

선택

유효한 값: 부동 소수점 (최소: 1e-3)

기본값: 무한대

encoder_layers

인코더에 있는 계층의 수와 각 계층의 출력 크기. auto로 설정된 경우 알고리즘은 3 x num_topics 및 2 x num_topics 크기의 계층 2개를 사용합니다.

선택

유효한 값: 양의 정수 또는 쉼표로 구분된 양의 정수auto

기본값: auto

encoder_layers_activation

인코더 계층에서 사용할 활성화 함수.

선택

유효한 값:

기본값: sigmoid

epochs

교육 데이터의 최대 전달 횟수.

선택

유효한 값: 양의 정수 (최소: 1)

기본값: 50

learning_rate

옵티마이저에 대한 학습률.

선택

유효한 값: 부동 소수점 (최소: 1e-6, 최대: 1.0)

기본값: 0.001

mini_batch_size

각 미니 배치에 있는 예제의 수.

선택

유효한 값: 양의 정수 (최소: 1, 최대 10000)

기본값: 256

num_patience_epochs

조기 중지 기준이 평가되는 연속적 epoch 수. 마지막 num_patience_epochs개의 epoch 수 내에서 손실 함수의 변화가 지정된 tolerance 미만으로 떨어지면 조기 중지가 트리거됩니다. 조기 중지를 비활성화하려면 num_patience_epochsepochs보다 높은 값으로 설정하십시오.

선택

유효한 값: 양의 정수 (최소: 1)

기본값: 3

optimizer

훈련에 사용할 옵티마이저

선택

유효한 값:

기본값: adadelta

rescale_gradient

그라디언트에 대한 크기 재조정 요소.

선택

유효한 값: 부동 소수점(최소: 1e-3, 최대: 1.0)

기본값: 1.0

sub_sample

훈련을 위해 epoch당 샘플링할 훈련 데이터의 일부.

선택

유효한 값: 부동 소수점 (최소: 0.0, 최대: 1.0)

기본값: 1.0

tolerance

손실 함수의 최대 상대 변화. 마지막 num_patience_epochs개의 epoch 수 내에서 손실 함수의 변화가 이 값 미만으로 떨어지면 조기 중지가 트리거됩니다.

선택

유효한 값: 부동 소수점 (최소: 1e-6, 최대: 0.1)

기본값: 0.001

weight_decay

가중치 감소 계수. L2 정규화를 추가합니다.

선택

유효한 값: 부동 소수점 (최소: 0.0, 최대: 1.0)

기본값: 0.0