k-NN 하이퍼파라미터 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

k-NN 하이퍼파라미터

파라미터 이름 설명
feature_dim

입력 데이터의 특징 수.

필수

유효한 값: 양수.

k

가장 가까운 이웃 수.

필수

유효한 값: 양수

predictor_type

데이터 레이블에 사용할 추론 유형.

필수

유효한 값: 분류의 경우 분류자 또는 회귀의 경우 regressor

sample_size

훈련 데이터 세트에서 샘플링할 데이터 포인트의 총 수.

필수

유효한 값: 양수

dimension_reduction_target

줄일 대상 차원.

필수를 지정할 때dimension_reduction_type파라미터.

유효한 값: 0보다 크고 feature_dim보다 작은 양의 정수.

dimension_reduction_type

차원 감소 메서드 유형.

선택

유효한 값: 무작위 투영의 경우 sign 또는 빠른 Johnson-Lindenstrauss 변환의 경우 fjlt

기본값: 차원 감소 없음

faiss_index_ivf_nlists

index_typefaiss.IVFFlat 또는 faiss.IVFPQ인 경우 인덱스 내에서 생성할 중심 수.

선택

유효한 값: 양수

기본값:auto, 이는 다음과 같이 해결됩니다.sqrt(sample_size).

faiss_index_pq_m

index_typefaiss.IVFPQ로 설정된 경우 인덱스 내에서 생성할 벡터 하위 구성 요소 수.

FAISS (FAISS) 라이브러리는faiss_index_pq_m은 (는) 의 제수입니다.데이터 차원. faiss_index_pq_m이 데이터 차원의 나눗수가 아닌 경우 데이터 차원을 faiss_index_pq_m으로 나눌 수 있는 가장 작은 정수로 늘립니다. 차원 감소가 적용되지 않는 경우 이 알고리즘은 제로 패딩을 추가합니다. 치수 축소가 적용된 경우알고리즘 의 가치를 늘리십시오dimension_reduction_target하이퍼 파라미터.

선택

유효한 값: 다음 양의 정수 중 하나입니다. 1, 2, 3, 4, 8, 12, 16, 20, 24, 28, 32, 40, 48, 56, 64, 96

index_metric

가장 가까운 이웃을 찾을 때 지점 간 거리를 측정하는 지표. 를 사용하여 훈련하는 경우index_type로 설정faiss.IVFPQ,그INNER_PRODUCT거리 및COSINE유사성은지원

선택

유효한 값: L2유클리드 거리,내부 제품제품 내부 거리를 위해,코사인코사인 유사성.

기본값: L2

index_type

인덱스의 유형.

선택

유효한 값: faiss.Flat,파이즈. 이브플플랫,파이스. IVFPQ.

기본값: faiss.Flat

mini_batch_size

데이터 반복자의 미니 배치당 관측치의 수.

선택

유효한 값: 양수

기본값: 5000