k-NN 모델 튜닝 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

k-NN 모델 튜닝

Amazon SageMaker k-nearest neighb알고리즘은 지도 알고리즘입니다. 이 알고리즘은 테스트 데이터 세트를 사용하고 분류 작업에 대한 정확도 관련 지표 또는 회귀 작업에 대한 평균 제곱근 오차 관련 지표를 내보냅니다. 이러한 정확도 지표는 경험적 테스트 데이터가 제공하는 실측 정보를 기준으로 각 작업에 대한 모델 예측을 비교합니다. 테스트 데이터 세트에 대해 가장 높은 정확도 또는 가장 낮은 오차를 보고하는 최적의 모델을 찾기 위해 k-NN에 대해 하이퍼파라미터 튜닝 작업을 실행할 수 있습니다.

하이퍼파라미터 튜닝이라고도 하는 자동 모델 튜닝은 데이터 세트에 대한 광범위한 하이퍼파라미터를 테스트하는 여러 작업을 실행하여 최적의 모델 버전을 찾습니다. 튜닝 가능한 하이퍼파라미터, 각 하이퍼파라미터에 대한 값 범위 및 목표 지표를 선택합니다. 알고리즘의 예측 작업에 적절한 목표 지표를 선택합니다. 자동 모델 튜닝은 선택한 하이퍼파라미터를 검색하여 목표 지표를 최적화하는 모델을 만드는 값 조합을 찾습니다. 이러한 하이퍼파라미터는 예측 모델 파라미터를 지원하기 위한 용도로만 사용하고, 훈련된 모델이 예측을 위해 사용하지 않습니다.

모델 튜닝에 대한 자세한 정보는 를 사용한 자동 모델 튜닝 수행 SageMaker 단원을 참조하십시오.

k-NN 알고리즘으로 계산되는 지표

k-nearest neighbors 알고리즘은 훈련 중 predictor_type 하이퍼파라미터가 지정한 작업 유형에 따라 다음 표에 있는 두 가지 지표 중 하나를 계산합니다.

  • 분류자는 분류 작업을 지정하고 test:accuracy를 계산합니다.

  • regressor는 회귀 작업을 지정하고 test:mse를 계산합니다.

모델 튜닝 시 관련 목표 지표를 계산하기 위해 수행되는 작업 유형에 적절한 predictor_type 값을 선택합니다.

지표 이름 설명 최적화 방향
test:accuracy

predictor_typeclassifier로 설정하면 k-NN은 k-nearest neighbors의 레이블 평균을 기반으로 예측 레이블을 test 채널 데이터에서 제공되는 실측 정보 레이블과 비교합니다. 보고되는 정확도 범위는 0.0(0%)~1.0(100%)입니다.

최대화

test:mse

predictor_typeregressor로 설정하면 k-NN은 k-nearest neighbors의 레이블 평균을 기반으로 예측 레이블을 test 채널 데이터에서 제공되는 실측 정보 레이블과 비교합니다. 평균 제곱근 오차는 두 레이블을 비교해 계산됩니다.

최소화

튜닝 가능한 k-NN 하이퍼파라미터

다음 하이퍼파라미터를 사용하여 Amazon SageMaker k-nearest neighbor 모델을 튜닝합니다.

파라미터 이름 파라미터 유형 권장 범위
k

IntegerParameterRanges

MinValue 1, MaxValue 1024

sample_size

IntegerParameterRanges

MinValue 256, MaxValue 20000000