항목 데이터 세트 - Amazon Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

항목 데이터 세트

Amazon Personalize로 가져올 수 있는 항목 데이터에는 생성 타임스탬프, 가격, 장르, 설명 및 재고 여부와과 같은 수치 및 범주형 메타데이터가 포함됩니다. 항목에 대한 메타데이터를 Amazon Personalize 항목 데이터 세트 로 가져옵니다.

Amazon Personalize는 교육 시 항목 제목 또는 작성자 데이터와 같은 비범주형 문자열 항목 데이터를 사용하지 않습니다. 하지만 일부 Amazon Personalize 기능은 이 데이터를 사용하여 권장 사항을 개선합니다. 자세한 정보는 비범주형 문자열 데이터 섹션을 참조하십시오.

최대 메타데이터 열 수는 100개입니다. 교육 중에 하나의 모델에서 고려되는 최대 항목 수는 750,000개입니다. Amazon Personalize는 권장 사항을 생성할 때 이러한 항목만 고려합니다. 일부 도메인과 레시피는 아이템 데이터 세트가 필요합니다. 레시피 요구 사항에 대한 자세한 내용은 레시피 선택 단원을 참조하세요.

이 주제는 다음 유형의 항목 데이터 데이터에 대한 정보를 제공합니다.

생성 타임스탬프 데이터

Amazon Personalize는 생성 타임스탬프 데이터(Unix epoch 시간 형식, 초 단위)를 사용하여 항목의 수명을 계산하고 그에 따라 권장 사항을 조정합니다.

하나 이상의 항목에 대한 생성 타임스탬프 데이터가 누락된 경우, Amazon Personalize는 상호작용 데이터(있는 경우)에서 이 정보를 유추하고 항목에서 가장 오래된 상호작용 데이터의 타임스탬프를 항목 생성 타임스탬프로 사용합니다. 항목에 상호작용 데이터가 없는 경우, 생성 타임스탬프는 교육 세트에 있는 최신 상호작용의 타임스탬프로 설정되며 Amazon Personalize는 이를 새 항목으로 간주합니다.

범주형 메타데이터

특정 레시피와 도메인을 통해 Amazon Personalize는 사용자에게 가장 관련성이 높은 항목을 나타내는 기본 패턴을 식별할 때 항목의 장르 또는 색상과 같은 범주형 메타데이터를 사용합니다. 사용 사례를 기반으로 자체 값 범위를 직접 정의합니다. 범주형 메타데이터는 어떤 언어로든 사용할 수 있습니다.

모든 레시피와 도메인을 통해 범주형 데이터를 가져와서 항목의 속성에 따라 권장사항을 필터링하는 데 사용할 수 있습니다. 권장 사항 필터링에 대한 자세한 내용은 추천 및 사용자 세그먼트 필터링 단원을 참조하세요.

범주형 값은 최대 1000자까지 입력할 수 있습니다. 범주형 값이 1000자를 초과하는 항목이 있는 경우, 데이터 세트 가져오기 작업이 실패합니다.

도메인 데이터 세트 그룹의 경우, VIDEO_ON_DEMAND 도메인과 ECOMMERCE 도메인 모두 범주형 메타데이터를 사용합니다. 사용자 지정 데이터 세트 그룹 및 사용자 지정 솔루션의 경우, 범주형 메타데이터를 사용하는 레시피에는 다음이 포함됩니다.

비정형 텍스트 메타데이터

특정 레시피와 도메인을 통해 Amazon Personalize는 제품 설명, 제품 리뷰 또는 영화 시놉시스와 같은 비정형 텍스트 메타데이터에서 중요한 정보를 추출할 수 있습니다. Amazon Personalize는 특히 새 항목이거나 상호작용 데이터가 적은 항목의 경우 구조화되지 않은 텍스트를 사용하여 사용자와 관련된 항목을 식별합니다. 아이템 데이터 세트에 구조화되지 않은 텍스트 데이터를 포함하여 카탈로그의 새 항목에 대한 클릭률과 전환률을 높이세요.

비정형 데이터를 사용하려면 유형 string이 있는 필드를 항목 스키마에 추가하고 필드 textual 속성을 true로 설정합니다. 그런 다음 대량 CSV 파일 및 개별 항목 가져오기에 텍스트 데이터를 포함합니다. 대량 CSV 파일의 경우, 텍스트를 큰따옴표로 묶습니다. \ 문자를 사용하여 데이터에 있는 큰따옴표 또는 \ 문자를 이스케이프처리합니다. 최대 1개의 텍스트 필드를 추가할 수 있습니다. 비정형 텍스트 데이터용 필드가 있는 항목 스키마의 예제는 항목 데이터 세트 스키마 예제(사용자 지정) 단원을 참조하세요. Amazon Personalize는 텍스트 필드를 글자 수 제한으로 잘라냅니다. 텍스트에서 가장 관련성이 높은 정보가 필드 시작 부분에 있는지 확인하세요. Amazon Personalize로 데이터를 가져오는 방법에 대한 자세한 내용은 단계 2: 데이터 준비 및 가져오기 단원을 참조하세요.

Amazon Personalize는 구조화되지 않은 텍스트 값을 사용하기 전에 텍스트에서 다음을 제거합니다.

  • HTML 및 XML 태그와 엔티티

  • 새 행, 탭, 추가 스페이스 문자

구조화되지 않은 텍스트 값은 중국어와 일본어를 제외한 모든 언어에서 최대 20,000자를 포함할 수 있습니다. 중국어와 일본어의 경우, 최대 7,000자까지 입력할 수 있습니다. Amazon Personalize는 문자 제한을 초과하는 값을 문자 제한까지 잘라냅니다.

텍스트는 다음 언어로 제공될 수 있습니다.

  • 중국어 간체

  • 중국어 번체

  • 영어

  • 프랑스어

  • 독일어

  • 일본어

  • 포르투갈어

  • 스페인어

구조화되지 않은 텍스트 항목을 여러 언어로 제출할 수 있지만, 각 항목의 텍스트는 한 가지 언어로만 작성해야 합니다.

도메인 데이터 세트 그룹의 경우, VIDEO_ON_DEMAND 도메인과 ECOMMERCE 도메인 모두 텍스트 메타데이터를 사용합니다. 사용자 지정 데이터 세트 그룹 및 사용자 지정 솔루션의 경우, 텍스트 메타데이터를 사용하는 레시피에 다음이 포함됩니다.

비범주형 문자열 데이터

항목 ID를 제외하고 Amazon Personalize는 교육 시 항목 제목 또는 작성자 데이터와 같은 비범주형 문자열 데이터를 사용하지 않습니다. 하지만 Amazon Personalize는 이를 다음과 같은 기능과 함께 사용할 수 있습니다.

  • Amazon Personalize는 추천에 비범주형 문자열 값을 비롯한 항목 메타데이터를 포함할 수 있습니다. 메타데이터를 통해 사용자 인터페이스에서 추천을 강화할 수 있습니다(예: 영화 추천 캐러셀에 감독 이름 추가). 자세한 정보는 추천에서 메타데이터 활성화을 참조하세요.

  • 유사-항목를 사용하면 테마가 포함된 배치 추천을 생성할 수 있습니다. 테마가 포함된 배치 추천을 생성할 때는 배치 추론 작업에서 항목 이름 열을 지정해야 합니다. 자세한 정보는 콘텐츠 생성기에서 테마가 있는 배치 추천을 참조하세요.

  • 필터를 생성하여 비범주형 문자열 데이터를 기반으로 항목을 추천에 포함하거나 추천에서 제거할 수 있습니다. 필터에 대한 자세한 내용은 추천 및 사용자 세그먼트 필터링 단원을 참조하세요.