기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
아이템 데이터
Amazon Personalize로 가져올 수 있는 항목 데이터에는 생성 타임스탬프, 가격, 장르, 설명 및 가용성과 같은 숫자 및 범주형 메타데이터가 포함됩니다. 아이템에 대한 메타데이터를 Amazon Personalize로 가져옵니다.항목 데이터세트. 메타데이터 열의 최대 개수는 100개입니다. 학습 중에 모델이 고려하는 최대 항목 수는 75만 개입니다. Amazon Personalize는 권장 사항을 생성할 때 이러한 항목만 고려합니다. 일부 도메인과 레시피에는 아이템 데이터세트가 필요합니다. 레시피 요건에 대해 자세히 알아보려면레시피 선택하기 API 키 키 키.
이 주제는 다음과 같은 유형의 항목 데이터에 대해 설명합니다.
타임스탬프 데이터 생성
Amazon Personalize는 생성 타임스탬프 데이터 (Unix epoch 시간 형식, 초 단위) 를 사용하여 항목의 수명을 계산하고 그에 따라 권장 사항을 조정합니다.
하나 이상의 항목에 대한 생성 타임스탬프 데이터가 누락된 경우 Amazon Personalize는 상호 작용 데이터 (있는 경우) 에서 이 정보를 유추하고 항목에서 가장 오래된 상호 작용 데이터의 타임스탬프를 항목 생성 타임스탬프로 사용합니다. 항목에 상호 작용 데이터가 없는 경우 생성 타임스탬프는 교육 세트에 있는 최신 상호 작용의 타임스탬프로 설정되며 Amazon Personalize는 이 항목을 새 항목으로 간주합니다.
범주형 메타데이터
Amazon Personalize는 특정 레시피와 도메인을 사용하여 사용자에게 가장 관련성이 높은 항목을 나타내는 기본 패턴을 식별할 때 항목의 장르 또는 색상과 같은 범주형 메타데이터를 사용합니다. 사용 사례에 따라 고유한 값 범위를 정의합니다. 범주형 메타데이터는 어떤 언어로든 사용할 수 있습니다.
모든 레시피와 도메인에서 범주형 데이터를 가져와서 항목의 속성에 따라 추천을 필터링하는 데 사용할 수 있습니다. 필터링 권장 사항에 대해 설명합니다.권장 사항 및 사용자 세그먼트 필터링.
범주형 값은 최대 1000자까지 사용할 수 있습니다. 범주형 값이 1000자를 초과하는 항목이 있는 경우 데이터세트 가져오기 작업이 실패합니다.
도메인 데이터세트 그룹의 경우 VIDEO_ON_DEMAND 도메인과 전자상거래 도메인 모두 범주형 메타데이터를 사용합니다. 커스텀 데이터세트 그룹 및 커스텀 솔루션의 경우 범주형 메타데이터를 사용하는 레시피에는 다음이 포함됩니다.
비정형 텍스트 메타데이터
Amazon Personalize는 특정 레시피와 도메인을 사용하여 제품 설명, 제품 리뷰 또는 영화 개요와 같은 비정형 텍스트 메타데이터에서 의미 있는 정보를 추출할 수 있습니다. Amazon Personalize는 특히 새 항목이거나 상호 작용 데이터가 적은 경우 구조화되지 않은 텍스트를 사용하여 사용자와 관련된 항목을 식별합니다. 아이템 데이터세트에 구조화되지 않은 텍스트 데이터를 포함하여 카탈로그의 새 항목에 대한 클릭률과 대화율을 높이십시오.
비정형 데이터를 사용하려면 유형이 있는 필드를 추가하세요.string
Items 스키마에 입력하고 필드의 스키마를 설정합니다.textual
속성true
. 그런 다음 대량 CSV 파일과 개별 항목 가져오기에 텍스트 데이터를 포함시키십시오. 대량 CSV 파일의 경우 텍스트를 큰따옴표로 묶습니다. 다음을 사용하십시오.\
데이터에 있는 큰따옴표나\ 문자를 이스케이프하려면 문자를 사용하십시오. 최대 1개의 텍스트 필드를 추가할 수 있습니다. 비정형 텍스트 데이터용 필드가 있는 Items 스키마의 예는 을 참조하십시오.아이템 데이터셋 스키마 예제 (사용자 지정). Amazon Personalize는 텍스트 필드를 글자 수 제한으로 잘라냅니다. 텍스트에서 가장 관련성이 높은 정보가 필드 시작 부분에 있는지 확인하십시오. Amazon Personalize로 데이터를 가져오는 방법에 대해 설명합니다.2단계: 데이터 준비 및 가져오기.
Amazon Personalize는 구조화되지 않은 텍스트 값을 사용하기 전에 텍스트에서 다음을 제거합니다.
HTML 및 XML 태그와 엔티티
새 줄, 탭, 추가 공백 문자
구조화되지 않은 텍스트 값은 중국어와 일본어를 제외한 모든 언어에서 최대 20,000자를 포함할 수 있습니다. 중국어와 일본어의 경우 최대 7,000자까지 입력할 수 있습니다. Amazon Personalize는 문자 제한을 초과하는 값을 문자 제한까지 잘라냅니다.
텍스트는 다음 언어로 제공될 수 있습니다.
-
중국어 간체
-
중국어 번체
-
영어
-
프랑스어
-
독일어
-
일본어
-
포르투갈어
-
스페인어
구조화되지 않은 텍스트 항목을 여러 언어로 제출할 수 있지만 각 항목의 텍스트는 한 가지 언어로만 작성해야 합니다.
도메인 데이터세트 그룹의 경우 VIDEO_ON_DEMAND 도메인과 ECOMMERCE 도메인 모두 텍스트 메타데이터를 사용합니다. 커스텀 데이터셋 그룹 및 커스텀 솔루션의 경우 텍스트 메타데이터를 사용하는 레시피에는 다음이 포함됩니다.