RCF 모델 튜닝 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

RCF 모델 튜닝

하이퍼파라미터 튜닝 및 하이퍼파라미터 최적화라고도 하는 자동 모델 튜닝은 데이터 세트에 대한 광범위한 하이퍼파라미터를 테스트하는 여러 작업을 실행하여 최적의 모델 버전을 찾습니다. 튜닝 가능한 하이퍼파라미터, 각 하이퍼파라미터에 대한 값 범위 및 목표 지표를 선택합니다. 알고리즘에서 계산하는 지표 중에서 목표 지표를 선택합니다. 자동 모델 튜닝은 선택한 하이퍼파라미터를 검색하여 목표 지표를 최적화하는 모델을 만드는 값 조합을 찾습니다.

Amazon SageMaker RCF 알고리즘은 하이퍼파라미터 최적화를 위해 라벨링된 테스트 데이터 세트가 필요한 비지도 이상 탐지 알고리즘입니다. RCF는 테스트 데이터 포인트에 대한 변칙 점수를 계산한 다음 점수가 평균 점수의 3가지 표준 편차를 벗어난 경우 해당 데이터 포인트를 변칙으로 레이블을 지정합니다. 이를 3 시그마 제한 휴리스틱(heuristic)이라고 합니다. F1 점수는 계산된 레이블과 실제 레이블 간의 차이를 기준으로 합니다. 하이퍼파라미터 튜닝 작업은 이 점수를 최대화하는 모델을 찾습니다. 하이퍼파라미터 최적화의 성공 여부는 테스트 데이터 세트에 대한 3-시그마 제한 휴리스틱(heuristic)의 적용 가능성에 따라 달라집니다.

모델 튜닝에 대한 자세한 정보는 다음을 사용하여 자동 모델 튜닝을 수행합니다. SageMaker 단원을 참조하십시오.

RCF 알고리즘으로 계산되는 지표

RCF 알고리즘은 훈련 중 다음 지표를 계산합니다. 모델을 튜닝하는 경우 이 지표를 목표 지표로 선택합니다.

지표 이름 설명 최적화 방향
test:f1

테스트 데이터 세트에 대한 F1 점수는 계산된 레이블과 실제 레이블 간의 차이를 기준으로 합니다.

최대화

튜닝 가능한 RCF 하이퍼파라미터

다음 하이퍼파라미터를 사용하여 RCF 모델을 튜닝할 수 있습니다.

파라미터 이름 파라미터 유형 권장 범위
num_samples_per_tree

IntegerParameterRanges

MinValue: 1, MaxValue:2048

num_trees

IntegerParameterRanges

MinValue: 50, MaxValue:1000