IP Insights 모델 튜닝 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

IP Insights 모델 튜닝

자동 모델 튜닝은 하이퍼파라미터 튜닝이라고도 하는데, 데이터 세트에 대해 광범위한 하이퍼파라미터 범위를 테스트하는 여러 작업을 실행하여 최적의 모델 버전을 찾습니다. 튜닝 가능한 하이퍼파라미터, 각 하이퍼파라미터에 대한 값 범위 및 목표 지표를 선택합니다. 알고리즘에서 계산하는 지표 중에서 목표 지표를 선택합니다. 자동 모델 튜닝은 선택한 하이퍼파라미터를 검색하여 목표 지표를 최적화하는 모델을 만드는 값 조합을 찾습니다.

모델 튜닝에 대한 추가 정보는 를 사용하여 자동 모델 튜닝을 수행하십시오. SageMaker 단원을 참조하세요.

IP Insights 알고리즘으로 계산되는 지표

Amazon SageMaker IP Insights 알고리즘은 IP 주소와 개체 간의 연관성을 학습하는 비지도 학습 알고리즘입니다. 이 알고리즘은 관측 데이터 포인트(포지티브 샘플)와 무작위로 생성된 데이터 포인트(네거티브 샘플)를 구분하도록 학습하는 판별자 모델을 훈련합니다. IP Insights에 대한 자동 모델 튜닝은 라벨링되지 않은 검증 데이터와 자동으로 생성된 네거티브 샘플을 가장 정확하게 구분할 수 있는 모델을 찾는데 도움을 줍니다. 유효성 검사 데이터 세트에 대한 모델 정확도는 Receiver Operating Characteristic(ROC) 곡선 아래의 면적으로 측정됩니다. 이 validation:discriminator_auc 지표는 0.0~1.0의 값을 가질 수 있는데, 여기서 1.0은 완벽한 정확도를 나타냅니다.

IP Insights 알고리즘은 검증 중 validation:discriminator_auc 지표를 계산해, 이 지표의 값을 하이퍼파라미터 튜닝을 위해 최적화하기 위한 목표 함수로 사용합니다.

지표 이름 설명 최적화 방향
validation:discriminator_auc

유효성 검사 데이터 세트의 ROC 곡선 아래 영역. 검증 데이터 세트는 라벨링되지 않습니다. Area Under the Curve(AUC)는 유효성 검사 데이터 포인트와 무작위로 생성된 데이터 포인트를 구분할 수 있는 모델의 능력을 나타내는 지표입니다.

최대화

튜닝 가능한 IP Insights 하이퍼파라미터

IP Insights 알고리즘에 대해 다음과 같은 하이퍼파라미터를 조정할 수 있습니다. SageMaker

파라미터 이름 파라미터 유형 권장 범위
epochs

IntegerParameterRange

MinValue: 1, MaxValue: 100

learning_rate

ContinuousParameterRange

MinValue: 1e-4, MaxValue: 0.1

mini_batch_size

IntegerParameterRanges

MinValue: 100, MaxValue: 5만

num_entity_vectors

IntegerParameterRanges

MinValue: 10000, MaxValue: 1000000

num_ip_encoder_layers

IntegerParameterRanges

MinValue: 1,: 10 MaxValue

random_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue: 10

shuffled_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue: 10

vector_dim

IntegerParameterRanges

MinValue: 8, MaxValue: 256

weight_decay

ContinuousParameterRange

MinValue: 0.0, MaxValue: 1.0