항목 데이터 - Amazon Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

항목 데이터

Amazon Personalize Personalize로 가져올 수 있는 아이템 데이터에는 생성 타임스탬프, 가격, 장르, 설명 및 가용성과 같은 숫자 및 범주형 메타데이터가 포함됩니다. 아이템에 대한 메타데이터를 Amazon Personalize 개인화로 임포트합니다.아이템 데이터세트. 일부 도메인과 레시피에는 Items 데이터세트가 필요합니다. 레시피 요구 사항에 대한 자세한 내용은 단원을 참조하십시오.1단계: 레시피 선택.

이 항목에서는 다음 항목 데이터 유형에 대해 설명합니다.

타임스탬프 데이터 생성

Amazon Personalize Personalize는 생성 타임스탬프 데이터 (Unix epoch 시간 형식 (초) 를 사용하여 항목의 사용 기간을 계산하고 그에 따라 권장 사항을 조정합니다.

하나 이상의 아이템에 대해 생성 타임스탬프 데이터가 누락된 경우 Amazon Personalize Personalize는 상호 작용 데이터에서 이 정보를 유추하고 아이템에서 가장 오래된 상호 작용 데이터의 타임스탬프를 항목의 생성 타임스탬프로 사용합니다. 항목에 상호 작용 데이터가 없는 경우 생성 타임스탬프가 교육 세트에서 최신 상호 작용의 타임스탬프로 설정되고 Amazon Personalize 이를 새 아이템으로 간주합니다.

범주형 메타데이터

특정 레시피 및 도메인의 경우 Amazon Personalize Personalize는 사용자에게 가장 관련성이 높은 아이템을 드러내는 기본 패턴을 식별할 때 항목의 장르나 색상과 같은 범주형 메타데이터를 사용합니다. 사용 사례를 바탕으로 고유한 값 범위를 정의합니다. 범주형 메타데이터는 모든 언어로 구성될 수 있습니다.

모든 레시피 및 도메인에서 범주형 데이터를 가져오고 이를 사용하여 항목의 속성을 기준으로 권장 사항을 필터링할 수 있습니다. 권장 사항 필터링에 대한 내용은 단원을 참조하십시오.권장 사항 및 사용자 세그먼트 필터링.

범주형 값은 최대 1000자까지 가능합니다. 범주형 값이 1000자 이상인 항목이 있는 경우 데이터세트 가져오기 작업이 실패합니다.

도메인 데이터세트 그룹의 경우 VIDEO_ON_DEMAND 도메인과 전자상거래 도메인 모두 범주형 메타데이터를 사용합니다. 사용자 지정 데이터세트 그룹 및 사용자 지정 솔루션의 경우 범주형 메타데이터를 사용하는 레시피에는 다음이 포함됩니다.

비정형 텍스트 메타데이터

특정 레시피 및 도메인에서 Amazon Personalize는 상품 설명, 상품 리뷰 또는 영화 개요와 같은 비정형 텍스트 메타데이터에서 의미 있는 정보를 추출할 수 있습니다. Amazon Personalize Personalize는 비정형 텍스트를 사용하여 사용자의 관련 항목을 식별합니다. 특히 아이템이 새 항목이거나 상호 작용 데이터가 적은 경우 더욱 그렇습니다. 항목 데이터세트에 구조화되지 않은 텍스트 데이터를 포함시켜 카탈로그의 새 항목에 대한 클릭률 및 대화율을 높일 수 있습니다.

비정형 데이터를 사용하려면 유형이 있는 필드를 추가합니다.stringItems 스키마로 이동하여 필드를 설정합니다.textual에 대한 속성true. 그런 다음 대량 CSV 파일에 텍스트 데이터를 포함시키고 증분 항목 가져오기를 수행합니다. 대량 CSV 파일의 경우 텍스트를 큰따옴표로 묶습니다. 사용\문자에서 큰따옴표 또는\ 문자를 이스케이프합니다. 구조화되지 않은 텍스트 데이터에 대한 필드가 있는 Items 스키마의 예는항목 데이터세트 스키마 예제 (사용자 정의). Amazon Personalize Personalize는 문자 제한에서 텍스트 필드를 잘라냅니다. 텍스트에서 가장 관련성이 높은 정보가 필드 시작 부분에 있는지 확인합니다. Amazon Personalize로 데이터를 가져오는 방법에 대한 자세한 내용은데이터 준비 및 가져오기.

구조화되지 않은 텍스트 값을 사용하기 전에 Amazon Personalize Personalize는 텍스트에서 다음을 제거합니다.

  • HTML 및 XML 태그 및 엔티티

  • 새 줄, 탭 및 추가 공백 문자

비정형 텍스트 값은 중국어와 일본어를 제외한 모든 언어에서 최대 20,000자를 가질 수 있습니다. 중국어와 일본어의 경우 최대 7,000자를 사용할 수 있습니다. Amazon Personalize Personalize는 문자 제한에 대한 문자 제한을 초과하는 값을 잘라냅니다.

텍스트는 다음 언어로 작성이 가능합니다.

  • 중국어 간체

  • 중국어 번체

  • 영어

  • 프랑스어

  • 독일어

  • 일본어

  • 포르투갈어

  • 스페인어

비정형 텍스트 항목은 여러 언어로 제출할 수 있지만 각 항목의 텍스트는 한 언어로만 제공되어야 합니다.

도메인 데이터세트 그룹의 경우 VIDEO_ON_DEMAND 도메인과 전자상거래 도메인 모두 텍스트 메타데이터를 사용합니다. 사용자 지정 데이터세트 그룹 및 사용자 지정 솔루션의 경우 텍스트 메타데이터를 사용하는 레시피에는 다음이 포함됩니다.