데이터세트 및 스키마 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터세트 및 스키마

Personalize 데이터세트는 데이터를 위한 컨테이너입니다. 다음과 같은 5가지 유형의 데이터 세트가 있습니다.

  • 항목 상호 작용 – 이 데이터 세트는 사용자와 항목 간 상호 작용의 이력 및 실시간 데이터를 저장합니다. Personalize에서 상호작용은 기록한 다음 교육 데이터로 가져오는 이벤트입니다. 도메인 데이터 세트 그룹과 사용자 지정 데이터 세트 그룹 모두에 대해 최소한의 항목 상호 작용 데이터 세트를 생성해야 합니다.

  • 사용자 – 이 데이터세트는 사용자에 대한 메타데이터를 저장합니다. 여기에는 연령, 성별, 로열티 멤버십 또는 항목 제목과 같은 정보가 포함될 수 있습니다.

  • 항목 – 이 데이터세트는 항목에 대한 메타데이터를 저장합니다. 여기에는 가격, SKU 유형 또는 재고 여부와 같은 정보가 포함될 수 있습니다.

  • 작업 – 이 데이터 세트는 작업에 대한 메타데이터를 저장합니다. 작업은 고객에게 추천하고 싶은 참여 활동입니다. 작업에는 모바일 앱 설치, 멤버십 프로필 작성, 로열티 프로그램 가입, 프로모션 이메일 구독 등이 포함될 수 있습니다. 차선책-작업 레시피의 경우 작업 데이터 세트가 필요합니다. 다른 사용자 지정 레시피나 도메인 사용 사례에서는 작업 데이터를 사용하지 않습니다.

  • 작업 상호 작용 – 이 데이터 세트는 사용자와 작업 간 상호 작용의 이력 및 실시간 데이터를 저장합니다. 차선책-작업 레시피는 이 데이터와 작업 데이터 세트의 데이터를 통해 사용자에게 작업을 추천합니다. 다른 사용자 지정 레시피나 도메인 사용 사례에서는 작업 상호 작용 데이터를 사용하지 않습니다.

각 데이터세트 그룹에는 한 가지 유형의 데이터세트만 있을 수 있습니다. 도메인 데이터세트 그룹에서는 액션 및 액션 인터랙션 데이터세트를 비롯한 차선책 액션 리소스를 만들 수 없습니다. Personalize는 사용자가 데이터세트를 삭제할 때까지 데이터세트에 데이터를 저장합니다. 모든 사용 사례(도메인 데이터세트 그룹) 및 레시피(사용자 지정 데이터세트 그룹)에 대해 상호작용 데이터에는 다음이 포함되어야 합니다.

  • 카탈로그의 항목과 상호 작용하는 사용자의 1,000개 이상의 항목 상호 작용 기록. 이러한 상호작용은 대량 가져오기, 스트리밍된 이벤트 또는 둘 다에서 발생할 수 있습니다.

  • 각각 2번 이상의 항목 상호 작용을 갖는 25개 이상의 고유 사용자 ID.

품질 추천의 경우, 각 2번 이상의 항목 상호 작용을 갖는 1,000명 이상의 사용자로부터 50,000건 이상의 항목 상호 작용을 갖는 것이 좋습니다.

데이터세트를 생성하기 전에 해당 데이터세트에 대한 스키마를 정의합니다. 스키마는 Personalize에 데이터 구조를 알려주고 Personalize가 데이터를 파싱할 수 있도록 해 줍니다. 스키마에는 값이 데이터세트 유형과 일치해야 하는 이름 키가 있습니다. 스키마를 생성하고 나면 스키마를 변경할 수 없습니다.

도메인 데이터세트 그룹의 경우, 각 데이터세트 유형에는 필수 필드와 예약된 키워드가 포함된 기본 스키마가 있습니다. 데이터세트를 생성할 때마다 기존 도메인 스키마를 사용하거나 기존 기본 스키마를 수정하여 새 도메인 스키마를 만들 수 있습니다. 기본 스키마를 도메인에 가져올 데이터에 대한 설명서로 사용하세요. 스키마를 정의하고 데이터세트를 생성한 후에는 스키마를 변경할 수 없습니다.

데이터를 대량으로 가져오는 경우, 데이터를 CSV(쉼표로 구분된 값) 형식으로 저장해야 합니다. CSV 파일의 첫 번째 행에는 스키마와 일치해야 하는 열 헤더가 포함되어야만 합니다. Personalize의 대량 데이터 형식 지정 방법에 대한 자세한 내용은 데이터 형식 지침단원을 참조하세요.