항목 데이터 세트 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

항목 데이터 세트

Personalize로 가져올 수 있는 항목 데이터에는 생성 타임스탬프, 가격, 장르, 설명 및 재고 여부와 같은 수치 및 범주형 메타데이터가 포함됩니다. 항목에 대한 메타데이터를 Personalize 항목 데이터세트로 가져옵니다.

Amazon Personalize는 교육 시 항목 제목 또는 작성자 데이터와 같은 비범주형 문자열 항목 데이터를 사용하지 않습니다. 하지만 일부 Amazon Personalize 기능은 이 데이터를 사용하여 권장 사항을 개선합니다. 자세한 정보는 비범주형 문자열 데이터섹션을 참조하십시오.

최대 메타데이터 열 수는 100개입니다. Amazon Personalize가 교육 중에 고려하는 최대 항목 수는 사용 사례 또는 레시피에 따라 다릅니다. 교육 중에 고려한 항목만 권장 사항에 표시될 수 있습니다.

  • 사용자 개인화-v2 또는 개인화 순위-v2의 경우 훈련 중에 모델이 고려하는 최대 항목 수는 5백만 개입니다. 이러한 항목은 항목 및 항목 상호 작용 데이터세트 모두에서 가져온 것입니다.

  • 사용자 맞춤화-v2 및 개인화 순위-v2를 제외한 모든 도메인 사용 사례 및 사용자 지정 레시피의 경우, 학습 및 추천 생성 과정에서 모델이 고려하는 최대 항목 수는 75만 개입니다.

레시피 선택레시피 요구 사항에 대한 자세한 내용은 을 참조하십시오.

이 주제는 다음 유형의 항목 데이터 데이터에 대한 정보를 제공합니다.

생성 타임스탬프 데이터

Personalize는 생성 타임스탬프 데이터(Unix epoch 시간 형식, 초 단위)를 사용하여 항목의 수명을 계산하고 그에 따라 추천을 조정합니다.

하나 이상의 항목에 대한 생성 타임스탬프 데이터가 누락된 경우, Personalize는 상호작용 데이터(있는 경우)에서 이 정보를 유추하고 항목에서 가장 오래된 상호작용 데이터의 타임스탬프를 항목 생성 타임스탬프로 사용합니다. 항목에 상호작용 데이터가 없는 경우, 생성 타임스탬프는 교육 세트에 있는 최신 상호작용의 타임스탬프로 설정되며 Personalize는 이를 새 항목으로 간주합니다.

범주형 메타데이터

특정 레시피와 도메인을 통해 Personalize는 사용자에게 가장 관련성이 높은 항목을 나타내는 기본 패턴을 식별할 때 항목의 장르 또는 색상과 같은 범주형 메타데이터를 사용합니다. 사용 사례를 기반으로 자체 값 범위를 직접 정의합니다. 범주형 메타데이터는 어떤 언어로든 사용할 수 있습니다.

모든 레시피와 도메인을 통해 범주형 데이터를 가져와서 항목의 속성에 따라 추천을 필터링하는 데 사용할 수 있습니다. 추천 필터링에 대한 자세한 내용은 추천 및 사용자 세그먼트 필터링단원을 참조하세요.

범주형 값은 최대 1000자까지 입력할 수 있습니다. 범주형 값이 1000자를 초과하는 항목이 있는 경우, 데이터세트 가져오기 작업이 실패합니다.

도메인 데이터세트 그룹의 경우, VIDEO_ON_DEMAND 도메인과 ECOMMERCE 도메인 모두 범주형 메타데이터를 사용합니다. 사용자 지정 데이터세트 그룹 및 사용자 지정 솔루션의 경우, 범주형 메타데이터를 사용하는 레시피에는 다음이 포함됩니다.

비정형 텍스트 메타데이터

특정 레시피와 도메인을 통해 Personalize는 제품 설명, 제품 리뷰 또는 영화 시놉시스와 같은 비정형 텍스트 메타데이터에서 중요한 정보를 추출할 수 있습니다. Personalize는 특히 새 항목이거나 상호작용 데이터가 적은 항목의 경우 구조화되지 않은 텍스트를 사용하여 사용자와 관련된 항목을 식별합니다. 아이템 데이터세트에 구조화되지 않은 텍스트 데이터를 포함하여 카탈로그의 새 항목에 대한 클릭률과 전환률을 높이세요.

비정형 데이터를 사용하려면 유형 string이 있는 필드를 항목 스키마에 추가하고 필드 textual속성을 true로 설정합니다. 최대 1개의 텍스트 필드를 추가할 수 있습니다. 그런 다음 대량 CSV 파일 및 개별 항목 가져오기에 텍스트 데이터를 포함합니다.

대량 CSV 파일의 경우 텍스트를 큰따옴표로 감싸고 새 줄 문자를 모두 제거합니다. \ 문자를 사용하여 데이터에 있는 큰따옴표 또는 \ 문자를 이스케이프처리합니다. 비정형 텍스트 데이터용 필드가 있는 항목 스키마의 예제는 항목 데이터세트 스키마 예제(사용자 지정)단원을 참조하세요. Personalize는 텍스트 필드를 글자 수 제한으로 잘라냅니다. 텍스트에서 가장 관련성이 높은 정보가 필드 시작 부분에 있는지 확인하세요. Personalize로 데이터를 가져오는 방법에 대한 자세한 내용은 단계 2: 데이터 준비 및 가져오기단원을 참조하세요.

구조화되지 않은 텍스트 값은 중국어와 일본어를 제외한 모든 언어에서 최대 20,000자를 포함할 수 있습니다. 중국어와 일본어의 경우, 최대 7,000자까지 입력할 수 있습니다. Personalize는 문자 제한을 초과하는 값을 문자 제한까지 잘라냅니다.

텍스트는 다음 언어로 제공될 수 있습니다.

  • 중국어 간체

  • 중국어 번체

  • 영어

  • 프랑스어

  • 독일어

  • 일본어

  • 포르투갈어

  • 스페인어

구조화되지 않은 텍스트 항목을 여러 언어로 제출할 수 있지만, 각 항목의 텍스트는 한 가지 언어로만 작성해야 합니다.

도메인 데이터세트 그룹의 경우, VIDEO_ON_DEMAND 도메인과 ECOMMERCE 도메인 모두 텍스트 메타데이터를 사용합니다. 사용자 지정 데이터세트 그룹 및 사용자 지정 솔루션의 경우, 텍스트 메타데이터를 사용하는 레시피에 다음이 포함됩니다.

비범주형 문자열 데이터

항목 ID를 제외하고 Amazon Personalize는 교육 시 항목 제목 또는 작성자 데이터와 같은 비범주형 문자열 데이터를 사용하지 않습니다. 하지만 Amazon Personalize는 이를 다음과 같은 기능과 함께 사용할 수 있습니다.

  • Amazon Personalize는 추천에 비범주형 문자열 값을 비롯한 항목 메타데이터를 포함할 수 있습니다. 메타데이터를 통해 사용자 인터페이스에서 추천을 강화할 수 있습니다(예: 영화 추천 캐러셀에 감독 이름 추가). 자세한 정보는 권장 사항의 항목 메타데이터을 참조하세요.

  • 유사-항목를 사용하면 테마가 포함된 배치 추천을 생성할 수 있습니다. 테마가 포함된 배치 추천을 생성할 때는 배치 추론 작업에서 항목 이름 열을 지정해야 합니다. 자세한 정보는 콘텐츠 생성기에서 테마가 있는 배치 추천을 참조하세요.

  • 필터를 생성하여 비범주형 문자열 데이터를 기반으로 항목을 추천에 포함하거나 추천에서 제거할 수 있습니다. 필터에 대한 자세한 내용은 추천 및 사용자 세그먼트 필터링단원을 참조하세요.