항목 상호 작용 데이터 세트 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

항목 상호 작용 데이터 세트

항목 상호 작용은 카탈로그의 항목과 사용자 간의 긍정적인 상호 작용 이벤트입니다. 영화를 보거나, 목록을 보거나, 신발을 구매하는 사용자를 예로 들 수 있습니다. 항목과 사용자의 상호 작용에 대한 데이터를 항목 상호 작용 데이터 세트로 가져옵니다. 클릭, 시청 또는 좋아요 등과 같은 여러 이벤트 유형을 기록할 수 있습니다.

예를 들어, 사용자가 특정 항목을 클릭한 다음 해당 항목에 좋아요를 누르면 Personalize에서 이러한 이벤트를 교육 데이터로 사용할 수 있게 만들 수 있습니다. 각 이벤트에 대해 사용자 ID, 항목 ID, 타임스탬프(Unix 타임 에포크 형식) 및 이벤트 유형(클릭 및 좋아요)을 기록합니다. 그런 다음 두 항목 상호 작용 이벤트를 항목 상호 작용 데이터 세트에 추가합니다.

모든 사용 사례(도메인 데이터 세트 그룹) 및 레시피(사용자 지정 리소스)에 대해 항목 상호 작용 데이터에는 다음이 포함되어야 합니다.

  • 카탈로그의 항목과 상호 작용하는 사용자의 1,000개 이상의 항목 상호 작용 기록. 이러한 상호작용은 대량 가져오기, 스트리밍된 이벤트 또는 둘 다에서 발생할 수 있습니다.

  • 각각 2번 이상의 항목 상호 작용을 갖는 25개 이상의 고유 사용자 ID.

품질 추천의 경우, 각 2번 이상의 항목 상호 작용을 갖는 1,000명 이상의 사용자로부터 50,000건 이상의 항목 상호 작용을 갖는 것이 좋습니다.

추천 또는 사용자 지정 솔루션을 만들려면 최소한 항목 상호 작용 데이터 세트를 만들어야 합니다. 이 섹션에서는 Amazon Personalize로 가져올 수 있는 다음과 같은 유형의 항목 상호 작용 데이터에 대한 정보를 제공합니다.

이벤트 유형 및 이벤트 값 데이터

항목 상호작용 데이터세트는 각 상호작용에 대한 이벤트 유형 및 이벤트 값 데이터를 저장할 수 있습니다. 사용자 지정 리소스만 이벤트 값 데이터를 사용합니다.

이벤트 유형 데이터

Amazon Personalize는 클릭 또는 구매 데이터와 같은 이벤트 유형 데이터를 사용하여 사용자 의도와 관심을 식별합니다. 도메인 추천자를 생성하는 경우 모든 사용 사례에는 이벤트 유형 데이터가 필요합니다. 일부 사용 사례에는 특정 이벤트 유형이 필요합니다. 추가 이벤트 유형을 자유롭게 사용할 수 있습니다. 자세한 내용은 사용 사례 선택단원을 참조하세요.

사용자 지정 리소스를 만드는 경우 교육에 사용할 이벤트를 이벤트 유형별로 선택할 수 있습니다. 데이터세트의 EVENT_TYPE 열에 여러 이벤트 유형이 있고 사용자 지정 솔루션을 구성할 때 이벤트 유형을 제공하지 않는 경우, Amazon Personalize는 유형에 관계없이 모든 항목 상호 작용 데이터를 동일한 가중치로 학습에 사용합니다. 자세한 정보는 교육에 사용할 항목 상호 작용 데이터 선택을 참조하세요.

포지티브 및 네거티브 이벤트 유형

Amazon Personalize는 모든 상호 작용이 긍정적인 것으로 가정합니다. 싫어요와 같은 부정적인 이벤트 유형과의 상호작용이 반드시 사용자의 향후 추천에 해당 항목이 표시되지 않는 것은 아닙니다.

부정적인 사건과 사용자의 무관심한 부분이 권장 사항에 영향을 미치도록 하는 방법은 다음과 같습니다.

  • 모든 도메인 사용 사례 및 사용자-개인 맞춤 레시피에 대해 Amazon Personalize는 노출 데이터를 사용할 수 있습니다. 노출 데이터에 항목이 나타나고 사용자가 선택하지 않으면 해당 항목이 추천에 나타날 가능성이 줄어듭니다. 자세한 정보는 노출 데이터을 참조하세요.

  • 사용자 지정 리소스를 사용하고 긍정적 및 부정적 이벤트 유형을 가져오는 경우 긍정적인 이벤트 유형만 학습시킨 다음 사용자가 부정적으로 상호작용한 항목을 필터링할 수 있습니다. 자세한 내용은 교육에 사용할 항목 상호 작용 데이터 선택추천 및 사용자 세그먼트 필터링 섹션을 참조하세요.

이벤트 값 데이터 (사용자 지정 리소스)

이벤트 값 데이터는 사용자가 본 영화의 비율 또는 10점 만점의 평점일 수 있습니다. 사용자 지정 솔루션을 만들고 이벤트 유형 데이터와 함께 이벤트 값 데이터를 가져오는 경우 유형 및 값을 기반으로 교육에 사용할 레코드를 선택할 수 있습니다. 도메인 추천자를 사용하면 Amazon Personalize는 이벤트 값 데이터를 사용하지 않으므로 교육 전에 이벤트를 필터링할 수 없습니다.

유형 및 값을 기준으로 레코드를 선택하려면 각 이벤트의 이벤트 유형과 이벤트 값을 기록하십시오. 각 이벤트에 대해 선택하는 값은 제외하려는 데이터와 기록하려는 이벤트 유형에 따라 달라집니다. 예를 들어, 시청 이벤트 유형별로 사용자가 시청한 동영상의 비율과 같은 사용자 활동을 일치시킬 수 있습니다.

솔루션을 구성할 때 특정 값을 임계값으로 설정하여 교육에서 레코드를 제외합니다. 예를 들어, 시청의 EVENT_TYPE이 포함된 이벤트의 EVENT_VALUE 데이터가 사용자가 시청한 동영상의 비율이고, 이벤트 값 임계값을 0.5로, 이벤트 유형을 시청으로 설정하면, Personalize는 EVENT_VALUE가 0.5 이상인 시청 상호작용 이벤트만 사용하여 모델을 교육합니다.

자세한 정보는 교육에 사용할 항목 상호 작용 데이터 선택섹션을 참조하십시오.

컨텍스트 메타데이터

Personalize는 특정 레시피와 추천 사용 사례를 통해 사용자에게 가장 관련성이 높은 항목을 나타내는 기본 패턴을 식별할 때 컨택스트 메타데이터를 사용할 수 있습니다. 컨텍스트 메타데이터는 이벤트 발생 시 사용자 환경에서 수집하는 상호작용 데이터(예: 위치 또는 디바이스 유형)입니다.

컨텍스트 메타데이터를 포함하면 기존 사용자에게 보다 개인화된 경험을 제공할 수 있습니다. 예를 들어, 고객이 휴대폰으로 카탈로그에 액세스할 때 컴퓨터와 다르게 쇼핑하는 경우, 사용자 기기에 대한 컨텍스트 메타데이터를 포함하세요. 그러면 고객의 검색 방식에 따라 관련성이 더 높은 추천이 제공될 수 있습니다.

또한 컨텍스트 메타데이터는 신규 사용자 또는 신원 미확인 사용자의 콜드 스타트 단계를 줄이는 데에도 도움이 됩니다. 콜드 스타트 단계는 권장 엔진이 해당 사용자에 대한 이력 정보의 부족으로 인해 관련성이 낮은 추천을 제공하는 기간을 말합니다.

도메인 데이터세트 그룹의 경우 다음과 같은 추천자 사용 사례에서 컨텍스트 메타데이터를 사용할 수 있습니다.

사용자 지정 리소스의 경우 컨텍스트 메타데이터를 사용하는 레시피에는 다음이 포함됩니다.

컨텍스트 정보에 대한 자세한 내용은 다음 AWS Machine Learning 블로그 게시물을 참조하십시오. 컨텍스트 정보를 활용하여 Amazon Personalize 권장 사항의 관련성 높이기.

노출 데이터

노출은 사용자가 특정 항목과 상호작용(예: 클릭 또는 시청)했을 때 볼 수 있었던 항목의 목록입니다. 개인화 또는 사용자-개인 맞춤 레시피를 제공하는 도메인 사용 사례를 사용하는 경우 Amazon Personalize는 노출 데이터를 사용하여 탐색을 안내할 수 있습니다.

탐색을 사용하면 추천에 새 항목 또는 작업, 상호 작용이 거의 없는 항목 또는 작업, 이전 행동을 기준으로 사용자와 관련성이 낮은 항목 또는 작업 등 일반적으로 사용자에게 추천될 가능성이 낮은 일부 항목 또는 작업이 포함됩니다. 노출 데이터에서 항목이 더 자주 나타날수록 Personalize에서 탐색에 해당 항목을 포함할 가능성이 낮아집니다.

추천자 또는 솔루션을 생성할 때 Amazon Personalize는 항상 노출 데이터를 교육에서 제외합니다. Amazon Personalize는 노출 데이터를 사용하여 모델을 학습시키지 않기 때문입니다. 대신 권장 사항을 받을 때 이를 사용하여 사용자의 탐색을 안내합니다.

노출 값은 최대 1000자(세로 막대 문자 포함)를 포함할 수 있습니다. 도메인 데이터세트 그룹의 경우 다음과 같은 추천자 사용 사례에서 노출 데이터를 사용할 수 있습니다.

탐색에 대한 자세한 내용은 탐색단원을 참조하세요. Personalize는 다음과 같은 두 가지 유형의 노출: 암시적 노출명시적 노출를 모델링할 수 있습니다.

암시적 노출

암시적 노출은 사용자에게 보여주는 Personalize에서 검색한 추천입니다. (GetRecommendationsGetPersonalizedRanking작업에서 반환한) RecommendationId를 향후 PutEvents요청에 대한 입력으로 포함하여 추천 워크플로우에 통합할 수 있습니다. Personalize는 추천 데이터를 기반으로 암시적 노출을 도출합니다.

예를 들면, 동영상 스트리밍을 위한 추천을 제공하는 애플리케이션이 있을 수 있습니다. 암시적 노출을 사용하는 추천 워크플로우는 다음과 같을 수 있습니다.

  1. Personalize GetRecommendationsAPI 작업을 사용하여 사용자 중 한 명에게 동영상 추천을 요청합니다.

  2. Personalize는 모델(솔루션 버전)을 사용하여 사용자를 위한 추천을 생성하고 API 응답에서 recommendationId와 함께 이를 반환합니다.

  3. 애플리케이션에서 사용자에게 동영상 추천을 보여줍니다.

  4. 사용자가 동영상과 상호작용하는 경우(예: 클릭), PutEventsAPI 직접 호출에 선택 사항을 기록하고 recommendationId를 파라미터로 포함합니다. 코드 샘플에 대해서는 노출 데이터 기록단원을 참조하세요.

  5. Personalize는 recommendationId를 사용하여 이전 동영상 권고 사항에서 노출 데이터를 추출한 다음 노출 데이터를 사용하여 탐색을 안내합니다. 이 경우, 향후 추천에는 상호작용 데이터 또는 관련성이 적은 새 동영상이 포함됩니다.

    암시적 노출 데이터를 사용한 이벤트 기록에 대한 자세한 내용은 노출 데이터 기록단원을 참조하세요.

명시적 노출

명시적 노출은 수동으로 기록하여 Personalize에 전송하는 노출입니다. 명시적 노출을 사용하여 Personalize의 결과를 조작할 수 있습니다. 품목 순서는 영향을 받지 않습니다.

예를 들면, 신발을 위한 추천을 제공하는 쇼핑 애플리케이션이 있을 수 있습니다. 현재 재고가 있는 신발만 추천하는 경우, 명시적인 노출을 사용하여 해당 품목을 지정할 수 있습니다. 명시적 노출을 사용하는 추천 워크플로우는 다음과 같을 수 있습니다.

  1. Personalize GetRecommendationsAPI를 사용하여 사용자 중 한 명에게 추천을 요청합니다.

  2. Personalize는 모델(솔루션 버전)을 사용하여 사용자를 위한 추천을 생성하고 API 응답에서 이를 반환합니다.

  3. 재고가 있는 권장 신발만 사용자에게 보여줍니다.

  4. 실시간 증분 데이터 가져오기의 경우, 사용자가 신발 한 켤레와 상호작용(예: 클릭)할 때 PutEventsAPI 직접 호출에 선택 항목을 기록하고 impression파라미터에 재고가 있는 권장 항목을 나열합니다. 코드 샘플에 대해서는 노출 데이터 기록단원을 참조하세요.

    이력 항목 상호 작용 데이터에서 노출을 가져오기 위해 csv 파일에 명시적 노출을 나열하고 각 항목을 '|' 문자로 구분할 수 있습니다. 세로 막대 문자는 1000자 한도에 포합됩니다. 관련 예제는 명시적 노출의 형식 지정단원을 참조하세요.

  5. Personalize는 노출 데이터를 사용하여 탐색을 안내하며, 향후 추천에는 상호작용 데이터 또는 관련성이 더 적은 새로운 신발이 포함됩니다.