기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
교육에 사용할 항목 상호 작용 데이터 선택
중요
기본적으로 모든 새 솔루션은 자동 학습을 사용합니다. 자동 학습을 사용하면 솔루션이 활성화되어 있는 동안 학습 비용이 발생합니다. 불필요한 비용을 방지하기 위해 완료되면 솔루션을 업데이트하여 자동 학습을 끌 수 있습니다. 학습 비용에 대한 자세한 내용은 Amazon Personalize 요금
솔루션 버전을 생성(모델 교육)할 때 Amazon Personalize가 사용하는 항목 상호 작용 데이터 세트의 이벤트를 선택할 수 있습니다. 교육 전에 항목 상호 작용 데이터를 선택하면 관련 데이터 하위 집합만 교육에 사용하거나 노이즈를 제거하여 더 최적화된 모델을 교육할 수 있습니다. 항목 상호 작용 데이터세트에 대한 자세한 내용은 항목 상호 작용 데이터 섹션을 참조하세요.
참고
User-Personalization-v2 또는 Personalized-Ranking-v2를 사용하는 경우 학습 비용은 이벤트 유형 또는 값으로 필터링하기 전에 항목 상호 작용 데이터를 기반으로 합니다. 요금에 대한 자세한 내용은 Amazon Personalize 요금
항목 상호 작용 데이터는 다음과 같이 선택할 수 있습니다.
-
유형을 기준으로 레코드 선택 – 솔루션을 구성할 때 항목 상호 작용 데이터 세트의 EVENT_TYPE 열에 이벤트 유형이 포함되어 있는 경우 교육에 사용할 이벤트 유형을 필요에 따라 지정할 수 있습니다. 예를 들어, 항목 상호 작용 데이터 세트에 구매, 클릭 및 시청 이벤트 유형이 포함되어 있고 Amazon Personalize가 시청 이벤트만 사용하여 모델을 교육하도록 하려는 경우, 솔루션을 구성할 때 Amazon Personalize가 교육에 사용하는
event type
과 동일한 시청을 제공하면 됩니다.항목 상호 작용 데이터 세트의 EVENT_TYPE 열에 여러 이벤트 유형이 있고 솔루션을 구성할 때 이벤트 유형을 제공하지 않은 경우, Amazon Personalize는 유형에 관계없이 모든 항목 상호 작용 데이터를 동일한 가중치로 학습하는 데 사용합니다.
-
유형 및 값을 기준으로 레코드 선택 – 솔루션을 구성할 때 항목 상호 작용 데이터 세트에 EVENT_TYPE 및 EVENT_VALUE 필드가 포함되어 있는 경우 특정 값을 임곗값으로 설정하여 교육에서 레코드를 제외할 수 있습니다. 예를 들어, 시청의 EVENT_TYPE이 포함된 이벤트의 EVENT_VALUE 데이터가 사용자가 시청한 동영상의 비율이고, 이벤트 값 임계값을 0.5로, 이벤트 유형을 시청으로 설정하면, Personalize는 EVENT_VALUE가 0.5 이상인 시청 상호작용 이벤트만 사용하여 모델을 교육합니다.
다음 코드는 SDK for Python(Boto3)을 사용하여 비디오의 절반 이상을 시청한 watch
이벤트만 사용하는 솔루션을 생성하는 방법을 보여줍니다.
import boto3
personalize = boto3.client('personalize')
create_solution_response = personalize.create_solution(
name = 'solution name',
datasetGroupArn = 'arn:aws:personalize:region:accountId:dataset-group/datasetGroupName',
recipeArn = 'arn:aws:personalize:::recipe/aws-user-personalization-v2',
eventType = 'watch',
solutionConfig = {
"eventValueThreshold": "0.5"
}
)
# Store the solution ARN
solution_arn = create_solution_response['solutionArn']
# Use the solution ARN to get the solution status
solution_description = personalize.describe_solution(solutionArn = solution_arn)['solution']
print('Solution status: ' + solution_description['status'])