HRNN-콜드 스타트 레시피 (레거시) - Amazon Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

HRNN-콜드 스타트 레시피 (레거시)

참고

레거시 HRNN 레시피를 더 이상 사용할 수 없습니다. 이 문서는 참고 용도로만 제공됩니다.

를 사용하는 것이 좋습니다. aws-user-personalizaton (사용자 개인화) 레거시 HRNN 레시피에 대한 레시피. 사용자 개인화는 HRNN 레시피가 제공하는 기능을 개선하고 통합합니다. 자세한 정보는 사용자 개인화 레시피을 참조하십시오.

새로운 항목과 상호 작용을 수시로 추가하고 이러한 항목에 대한 권장 사항을 즉시 받고 싶은 경우 HRNN-Coldstart 레시피를 사용하면 사용자가 상호 작용할 항목을 예측할 수 있습니다. HRNN-Coldstart 레시피는 HRNN-Metadata 레시피와 유사하지만 이를 통해 새 항목에 대한 권장 사항을 가져올 수 있습니다.

또한 상호 작용이 매우 특이하여 교육 시 노이즈가 발생할 수 있거나, 최신 인기 추세로 인해 상호 작용이 많은 교육 항목에서 제외하고자 할 때도 HRNN-Coldstart 레시피를 사용할 수 있습니다. HRNN-Coldstart를 사용하면 관련성이 적은 항목을 필터링으로 제외하여 교육의 하위 집합을 생성할 수 있습니다. 콜드 항목이라고 하는 항목의 하위 집합은 관련된 상호 작용 이벤트가 상호 작용 데이터 세트에 있는 항목입니다. 항목은 다음과 같은 경우에 콜드 항목으로 간주됩니다.

  • 지정된 최대 상호 작용 수보다 상호 작용이 더 적은 경우 레시피의 cold_start_max_interactions 하이퍼파라미터에서 이 값을 지정합니다.

  • 최대 기간보다 상대 기간이 더 짧은 경우 레시피의 cold_start_max_duration 하이퍼파라미터에서 이 값을 지정합니다.

콜드 항목 수를 줄이려면 cold_start_max_interactions 또는 cold_start_max_duration에 대한 값을 작게 설정합니다. 콜드 항목 수를 늘리려면 cold_start_max_interactions 또는 cold_start_max_duration에 대한 값을 크게 설정합니다.

HRNN-Coldstart의 콜드 항목 제한은 다음과 같습니다.

  • Maximum cold start items: 80,000

  • Minimum cold start items: 100

콜드 항목 수가 이 범위를 벗어나는 경우 솔루션 생성 시도는 실패합니다.

HRNN-Coldstart 레시피의 속성은 다음과 같습니다.

  • 이름aws-hrnn-coldstart

  • 레시피 Amazon 리소스 이름(ARN)arn:aws:personalize:::recipe/aws-hrnn-coldstart

  • 알고리즘 ARNarn:aws:personalize:::algorithm/aws-hrnn-coldstart

  • 기능 변환 ARNarn:aws:personalize:::feature-transformation/featurize_coldstart

  • 레시피 유형USER_PERSONALIZATION

자세한 정보는 1단계: 레시피 선택을 참조하십시오.

다음 표에서는 HRNN-Coldstart 레시피의 하이퍼파라미터를 설명합니다. 하이퍼파라미터는 모델 성능을 향상시키기 위해 조정할 수 있는 알고리즘 파라미터입니다. 알고리즘 하이퍼파라미터는 모델이 성능을 내는 방식을 제어합니다. 기능화 하이퍼파라미터는 교육에서 사용할 데이터를 필터링하는 방법을 제어합니다. 하이퍼파라미터에 대한 최적 값을 선택하는 과정을 하이퍼파라미터 최적화(HPO)라고 합니다. 자세한 정보는 하이퍼파라미터 및 HPO을 참조하십시오.

표에는 각 하이퍼파라미터에 대한 다음 정보도 표시됩니다.

  • 범위: [하한, 상한]

  • 값 유형: 정수, 연속 (부동 소수점), 범주 (부울, 목록, 문자열)

  • 조정 가능한 HPO: HPO 에 참여할 수 있습니까?

이름 설명
알고리즘 하이퍼파라미터
hidden_dimension

모델에 사용된 숨겨진 변수 개수 숨겨진 변수는 사용자의 구매 기록 및 항목 통계를 재생성하여 순위 결정 점수를 생성합니다. 상호 작용 데이터 세트에 더 복잡한 패턴이 포함되는 경우 더 많은 숨겨진 차원을 지정합니다. 더 많은 숨겨진 차원을 사용하는 데는 더 큰 데이터 세트와 더 많은 처리 시간이 필요합니다. 최적 값을 결정하려면 HPO를 사용합니다. HPO를 사용하려면 CreateSolutionCreateSolutionVersion 작업 호출 시 performHPOtrue에 설정합니다.

기본값: 149

범위: [32, 256]

값 형식: Integer

HPO 조정 가능: 예

bptt

시간 기법을 통한 역전파를 사용할지 여부를 결정합니다. 시간을 기준으로 한 역전파는 반복 신경망 기반 알고리즘의 가중치를 업데이트하는 기법입니다. 장기 크레딧에 대한 bptt를 사용하여 지연된 보상을 초기 이벤트에 연결합니다. 예를 들어 지연된 보상은 여러 번 클릭 후 이루어진 구매일 수 있습니다. 초기 이벤트는 초기 클릭일 수 있습니다. 클릭과 같은 동일한 이벤트 유형 내에서도 장기 효과를 고려하고 전체 보상을 최대화하는 것이 좋습니다. 장기 효과를 고려하려면 더 큰 bptt 값을 사용합니다. 더 큰 bptt 값을 사용하는 데는 더 큰 데이터 세트와 더 많은 처리 시간이 필요합니다.

기본값: 32

범위: [2, 32]

값 형식: Integer

HPO 조정 가능: 예

recency_mask

모델이 상호 작용 데이터 세트의 최신 인기 트렌드를 고려해야 하는지 여부를 결정합니다. 최신 인기 트렌드에는 상호 작용 이벤트 기본 패턴의 갑작스러운 변경이 포함될 수 있습니다. 최신 이벤트에 더 많은 가중치를 부여하는 모델을 교육하려면 recency_masktrue에 설정합니다. 지난 모든 상호 작용에 동일한 가중치를 부여하는 모델을 교육하려면 recency_maskfalse에 설정합니다. 동일한 가중치를 사용하여 좋은 권장 사항을 가져오려면 더 큰 교육 데이터 세트가 필요할 수 있습니다.

기본값: True

범위: True 또는 False

값 형식: 부울

HPO 조정 가능: 예

기능화 하이퍼파라미터
cold_start_max_interactions

항목에 대한 최대 사용자 항목 상호 작용 수를 콜드 항목으로 간주해야 될 수 있습니다.

기본값: 15

범위: 양의 정수

값 형식: Integer

HPO 조정 가능: 아니요

cold_start_max_duration

콜드 스타트 항목으로 간주될 사용자 항목 상호 작용에 대한 시작점에 비례하는 최대 기간(일) 사용자 항목 상호 작용의 시작점을 설정하려면 cold_start_relative_from 하이퍼파라미터를 설정합니다.

기본값: 5.0

범위: 양의 부동 소수점

값 형식: Float

HPO 조정 가능: 아니요

cold_start_relative_from

cold_start_max_duration을 계산하는 HRNN-Coldstart 레시피의 시작점을 결정합니다. 현재 시간부터 계산하려면 currentTime을 선택합니다.

상호 작용 데이터 세트의 최신 항목의 타임스탬프부터 cold_start_max_duration을 계산하려면 latestItem을 선택합니다. 이 설정은 새 항목을 수시로 추가하는 경우 유용합니다.

기본값: latestItem

범위: currentTime, latestItem

값 형식: 문자열

HPO 조정 가능: 아니요

min_user_history_length_percentile

모델 교육에 포함할 사용자 기록 길이의 최소 백분위수. 기록 길이는 사용자에 대한 데이터의 총 용량입니다. min_user_history_length_percentile을 사용하여 기록 길이가 짧은 사용자의 백분율을 제외합니다. 기록 길이가 짧은 사용자는 사용자의 개인 요구나 필요 대신에 항목 인기 기반의 패턴을 종종 보입니다. 이 패턴을 제거하면 데이터의 기본 패턴에 더 많이 집중하며 모델을 교육할 수 있습니다. 히스토그램 또는 유사한 도구를 사용하여 사용자 기록 길이를 검토한 후 적절한 값을 선택합니다. 다수의 사용자를 유지하되 엣지 케이스를 제거하는 값을 설정하는 것이 좋습니다.

예를 들어 min__user_history_length_percentile to 0.05max_user_history_length_percentile to 0.95 설정에는 기록 길이가 하위 또는 상위 5%에 해당하는 사용자를 제외한 모든 사용자가 포함됩니다.

기본값: 0.0

범위: [0.0, 1.0]

값 형식: Float

HPO 조정 가능: 아니요

max_user_history_length_percentile

모델 교육에 포함할 사용자 기록 길이의 최대 백분위수. 기록 길이는 사용자에 대한 데이터의 총 용량입니다. max_user_history_length_percentile을 사용하여 기록 길이가 긴 사용자의 백분율을 제외합니다. 이러한 사용자의 데이터에는 노이즈가 포함되는 경향이 있기 때문입니다. 예를 들어 로봇은 자동화된 상호 작용의 긴 목록을 포함할 수 있습니다. 이러한 사용자를 제거하는 경우 교육 시 노이즈가 제한됩니다. 히스토그램 또는 유사한 도구를 사용하여 사용자 기록 길이를 검토한 후 적절한 값을 선택합니다. 다수의 사용자를 유지하되 엣지 케이스를 제거하는 값을 설정하는 것이 좋습니다.

예를 들어 min__user_history_length_percentile to 0.05max_user_history_length_percentile to 0.95 설정에는 기록 길이가 하위 또는 상위 5%에 해당하는 사용자를 제외한 모든 사용자가 포함됩니다.

기본값: 0.99

범위: [0.0, 1.0]

값 형식: Float

HPO 조정 가능: 아니요