SIMS 레시피 - Amazon Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SIMS 레시피

참고

모든 RELATED_ITEMS 레시피는 상호작용 데이터를 사용합니다. 모델에 더 많은 하이퍼파라미터를 구성하려는 경우 SIMS를 선택합니다. 항목 메타데이터가 있고 Amazon Personalize에서 해당 메타데이터를 사용하여 유사한 항목을 찾도록 하려면 유사-항목 레시피를 선택합니다.

I tem-to-item 유사성 (SIMS) 레시피는 공동 필터링을 사용하여 추천을 받을 때 지정한 항목과 가장 유사한 항목을 추천합니다. SIMS는 색상이나 가격 같은 항목 메타데이터가 아닌 항목 상호 작용 데이터 세트를 사용하여 유사성을 판단합니다. SIMS는 상호작용 데이터 세트의 사용자 이력에서 해당 항목이 동시에 발생한 경우를 식별하여 유사한 항목을 추천합니다. 예를 들어 Amazon Personalize는 SIMS를 사용하여 고객이 자주 함께 구매하는 커피숍 항목이나 다른 사용자가 함께 본 영화를 추천할 수 있습니다.

유사한 항품 추천을 받으면 요청에 지정한 항목의 속성을 기준으로 항목을 필터링할 수 있습니다. 이렇게 하려면 필터에 CurrentItem.attribute 요소를 추가합니다. 예시는 item data filter examples 단원을 참조하세요.

SIMS를 사용하려면 1,000개 이상의 고유한 과거 상호 작용과 이벤트 상호 작용(합산)이 포함된 항목 상호 작용 데이터 세트를 만들어야 합니다. SIMS는 추천을 생성할 때 사용자 또는 항목 데이터세트의 데이터를 사용하지 않습니다. 여전히 이러한 데이터 세트의 데이터를 기반으로 추천을 필터링할 수 있습니다. 자세한 내용은 추천 및 사용자 세그먼트 필터링 단원을 참조하세요.

항목에 대한 사용자 행동 데이터가 충분하지 않거나 제공한 항목 ID를 찾을 수 없는 경우 SIMS는 인기 있는 항목을 추천합니다. 솔루션 버전을 만든 후에는 솔루션 버전과 데이터를 최신 상태로 유지해야 합니다. SIMS를 사용하면 Amazon Personalize용 새 솔루션 버전을 수동으로 생성 (모델 재교육) 하여 새 항목을 추천하고 사용자의 최신 동작으로 모델을 업데이트해야 합니다. 그런 다음 솔루션 버전을 사용하여 모든 캠페인을 업데이트해야 합니다. 자세한 설명은 추천 관련성 유지 섹션을 참조하세요.

SIMS 레시피의 속성은 다음과 같습니다.

  • 명칭aws-sims

  • 레시피 Amazon 리소스 이름(ARN) - arn:aws:personalize:::recipe/aws-sims

  • 알고리즘 ARN - arn:aws:personalize:::algorithm/aws-sims

  • 특성 변환 ARN - arn:aws:personalize:::feature-transformation/sims

  • 레시피 유형 - RELATED_ITEMS

다음 표에서는 SIMS 레시피의 하이퍼파라미터를 설명합니다. 하이퍼파라미터는 모델 성능을 향상시키기 위해 조정할 수 있는 알고리즘 파라미터입니다. 알고리즘 하이퍼파라미터는 모델이 성능을 내는 방식을 제어합니다. 특성화 하이퍼파라미터는 학습에서 사용할 데이터를 필터링하는 방법을 제어합니다. 하이퍼파라미터에 대한 최적 값을 선택하는 과정을 하이퍼파라미터 최적화(HPO)라고 합니다. 자세한 내용은 하이퍼파라미터 및 HPO 단원을 참조하세요.

표에는 각 하이퍼파라미터에 대한 다음 정보도 표시됩니다.

  • 범위: [하한, 상한]

  • 값 형식: 정수, 연속(부동 소수점), 범주(부울, 목록, 문자열)

  • 조정 가능한 HPO: 파라미터가 하이퍼파라미터 최적화(HPO)에 참여할 수 있습니까?

명칭 설명
알고리즘 하이퍼파라미터
popularity_discount_factor

인기도가 추천에 미치는 영향을 구성합니다. 더 인기 있는 항목을 포함시키려면 0에 가까운 값을 지정합니다. 인기도 강조를 줄이려면 1에 가까운 값을 지정합니다.

기본 값: 0.5

범위: [0.0, 1.0]

값 형식: 부동 소수점

HPO 조정 가능: 예

min_cointeraction_count

항목 한 쌍 간의 유사성을 계산하는 데 필요한 최소 공동 상호작용의 수. 예를 들어 3의 값은 유사성을 계산하기 위해 알고리즘에 대해 양쪽 항목과 상호작용한 세 명 이상의 사용자가 필요함을 의미합니다.

기본 값: 3

범위: [0, 10]

값 형식: 정수

HPO 조정 가능: 예

특성화 하이퍼파라미터
min_user_history_length_percentile

모델 학습에 포함시킬 사용자 이력 길이의 최소 백분위수. 이력 길이는 사용자에 대해 사용 가능한 데이터의 총 용량입니다. 이력 길이가 짧은 사용자의 백분율을 제외시키려면 min_user_history_length_percentile을 사용합니다. 이력 길이가 짧은 사용자는 사용자의 개인 요구나 필요 대신에 항목 인기 기반의 패턴을 종종 보입니다. 이 패턴을 제거하면 데이터의 기본 패턴에 더 많이 집중하며 모델을 학습시킬 수 있습니다. 히스토그램 또는 유사한 도구를 사용하여 사용자 이력 길이를 검토한 후 적절한 값을 선택합니다. 다수의 사용자를 유지하되 극단적 경우를 제거하는 값을 설정하는 것이 좋습니다.

기본 값: 0.005

범위: [0.0, 1.0]

값 형식: 부동 소수점

HPO 조정 가능: 아니요

max_user_history_length_percentile

모델 학습에 포함시킬 사용자 이력 길이의 최대 백분위수. 이력 길이는 사용자에 대해 사용 가능한 데이터의 총 용량입니다. 이력 길이가 짧은 사용자의 백분율을 제외시키려면 max_user_history_length_percentile을 사용합니다. 이력 길이가 긴 사용자는 노이즈를 포함하는 경향이 있습니다. 예를 들어 로봇은 자동화된 상호작용의 긴 목록을 포함할 수 있습니다. 이러한 사용자를 제거하는 경우 학습 시 노이즈가 제한됩니다. 히스토그램 또는 유사한 도구를 사용하여 사용자 이력 길이를 검토한 후 적절한 값을 선택합니다. 다수의 사용자를 유지하되 극단적 경우를 제거하는 값을 설정하는 것이 좋습니다.

예를 들어 min_hist_length_percentile = 0.05max_hist_length_percentile = 0.95를 설정하면 이력 길이가 하위 또는 상위 5%에 해당하는 사용자를 제외한 모든 사용자가 포함됩니다.

기본 값: 0.995

범위: [0.0, 1.0]

값 형식: 부동 소수점

HPO 조정 가능: 아니요

min_item_interaction_count_percentile

모델 학습에 포함시킬 항목 상호작용 수의 최대 백분위수. 상호작용의 이력이 짧은 항목의 백분율을 제외시키려면 min_item_interaction_count_percentile을 사용합니다. 이력이 짧은 항목은 종종 새 항목입니다. 이 항목을 제거하면 이력이 알려진 항목에 더 집중하며 모델을 학습시킬 수 있습니다. 히스토그램 또는 유사한 도구를 사용하여 사용자 이력 길이를 검토한 후 적절한 값을 선택합니다. 다수의 사용자를 유지하되 극단적 경우를 제거하는 값을 설정하는 것이 좋습니다.

기본 값: 0.01

범위: [0.0, 1.0]

값 형식: 부동 소수점

HPO 조정 가능: 아니요

max_item_interaction_count_percentile

모델 학습에 포함시킬 항목 상호작용 수의 최소 백분위수. 상호작용의 이력이 긴 항목의 백분율을 제외시키려면 max_item_interaction_count_percentile을 사용합니다. 이력이 긴 항목은 오래된 경향이 있고 날짜가 만료될 수 있습니다. 예를 들어 절판된 영화 릴리스입니다. 이 항목을 제거하면 더 많은 관련 항목에 집중할 수 있습니다. 히스토그램 또는 유사한 도구를 사용하여 사용자 이력 길이를 검토한 후 적절한 값을 선택합니다. 다수의 항목을 유지하되 극단적 경우를 제거하는 값을 설정하는 것이 좋습니다.

예를 들어 min_item_interaction_count_percentile = 0.05max_item_interaction_count_percentile = 0.95에는 상호작용 수가 하위 또는 상위 5%에 해당하는 항목을 제외한 모든 항목이 포함됩니다.

기본 값: 0.9

범위: [0.0, 1.0]

값 형식: 부동 소수점

HPO 조정 가능: 아니요

SIMS 샘플 노트북

SIMS 레시피의 사용 방법을 보여주는 Jupyter Notebook 샘플은 유사 항목 찾기 + HPO를 참조하세요.