항목 데이터셋 요구 사항 (사용자 지정) - Amazon Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

항목 데이터셋 요구 사항 (사용자 지정)

원래 요청 ping에 대한아이템 데이터셋카탈로그에 있는 항목에 대한 메타데이터를 저장합니다. 여기에는 각 항목의 가격, 장르 및 가용성 등과 같은 정보가 포함될 수 있습니다. Amazon Personalize 로 가져올 수 있는 항목 데이터 유형에 대한 자세한 내용은 단원을 참조하십시오.항목 데이터.

각 항목에 대해 제공하는 데이터는 Items 데이터셋 스키마와 일치해야 합니다. 최소한 각 항목의 항목 ID (최대 길이 256자) 를 제공해야 합니다. 스키마에 따라 항목 메타데이터에는 비어 있는/null 값이 포함될 수 있습니다. 스키마에는 최소 하나의 메타데이터 필드가 있어야 하지만null를 입력합니다. 이 값은 항목에 대해 null일 수 있습니다. 사용 사례와 데이터에 따라 다른 필드를 자유롭게 추가할 수 있습니다. 필드가 필수 또는 예약으로 나열되지 않고 데이터 유형이Schema 데이터 형식의 경우 필드 이름과 데이터 형식은 사용자에게 달려 있습니다.

범주형 데이터를 사용하려면 유형 필드를 추가합니다.string필드의 범주형 속성을trueSCHEM에서 그런 다음 대량 CSV 파일 및 개별 항목 가져오기에 범주형 데이터를 포함합니다. 범주형 값은 최대 1000자를 포함할 수 있습니다. 범주형 값이 1000자를 초과하는 항목이 있는 경우 데이터세트 가져오기 작업이 실패합니다.

범주가 여러 개인 항목의 경우 각 값을 세로 막대 '|'로 구분합니다. 예를 들어 GENRES 필드의 경우 항목에 대한 데이터는 다음과 같을 수 있습니다.Action|Crime|Biopic. 여러 수준의 범주형 데이터가 있고 일부 항목에 계층의 각 수준에 대해 여러 범주가 있는 경우 각 수준에 대한 필드를 추가하고 각 필드 이름 뒤에 수준 표시기를 추가합니다. 장르, 장르_L2, 장르_L3. 이렇게 하면 항목이 여러 다중 레벨 범주에 속하더라도 하위 범주를 기반으로 권장 사항을 필터링할 수 있습니다 (필터 생성 및 사용에 대한 자세한 내용은 을 참조하십시오.권장 사항 및 사용자 세그먼트 필터링). 예를 들어 동영상에는 각 카테고리 수준에 대해 다음과 같은 데이터가 있을 수 있습니다.

  • 장르: 액션|어드벤처

  • 장르_L2: 범죄 | 서양

  • 장르_L3: 일대기의

이 예에서 동영상은 액션 > 범죄 > 일대기의 계층 구조에 있습니다.어드벤처 > 웨스턴 > 일대기의 계층 최대 L3까지만 사용하는 것이 좋지만 필요한 경우 더 많은 레벨을 사용할 수 있습니다.

모델 교육 중에 Amazon Personalize는 최대 750,000개의 항목을 고려합니다. 750,000개가 넘는 항목을 가져오는 경우 Amazon Personalize 새 항목 (최근에 상호작용 없이 추가한 항목) 과 최근 상호작용 데이터가 있는 기존 항목을 포함하는 것을 강조하면서 교육에 포함할 항목을 결정합니다.

Items 데이터셋의 최소 요구 사항 및 최대 데이터 제한에 대한 자세한 내용은 단원을 참조하십시오.서비스 할당량.

Items 데이터셋 스키마 예제 (사용자 지정)

다음 예제는 항목 스키마 (Items) 를 구성하는 방법을 보여줍니다. ITEM_ID 필드는 필수입니다. 이GENRE필드는 범주형 메타데이터이고DESCRIPTION필드는 텍스트 메타데이터입니다. 하나 이상의 메타데이터 필드가 필요합니다. 최대 50개의 메타데이터 필드를 추가할 수 있습니다. 이CREATION_TIMESTAMP필드는 예약된 키워드입니다. 스키마 요구 사항에 대한 자세한 내용은 단원을 참조하십시오.사용자 지정 데이터세트 및 스키마 요구 사항.

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true }, ], "version": "1.0" }

이 스키마의 경우 CSV 파일의 처음 몇 줄은 다음과 비슷할 수 있습니다.

ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION 1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004." 2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010." 3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women." 4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020." ... ...