스키마 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

스키마

스키마는 Personalize에 데이터 구조를 알려주고 Personalize가 데이터를 파싱할 수 있도록 해 줍니다. 스키마에는 값이 데이터세트 유형과 일치해야 하는 이름 키가 있습니다. 스키마를 생성하고 나면 스키마를 변경할 수 없습니다.

도메인 데이터세트 그룹의 경우, 각 데이터세트 유형에는 필수 필드와 예약된 키워드가 포함된 기본 스키마가 있습니다. 데이터세트를 생성할 때마다 기존 도메인 스키마를 사용하거나 기존 기본 스키마를 수정하여 새 도메인 스키마를 만들 수 있습니다. 기본 스키마를 도메인에 가져올 데이터에 대한 설명서로 사용하세요. 스키마를 정의하고 데이터세트를 생성한 후에는 스키마를 변경할 수 없습니다.

스키마 서식 지적 요구 사항

도메인 데이터세트 그룹 또는 사용자 지정 데이터세트 그룹에 대한 스키마를 생성할 때는 다음 지침을 따라야만 합니다.

  • Avro 형식으로 스키마를 정의해야 합니다. 지원되는 Avro 데이터 유형에 대한 자세한 내용은 스키마 데이터 유형을 참조하세요.

  • 스키마 필드는 순서대로 나타날 수 있지만, CSV 파일의 해당 열 헤더의 순서와 일치해야 합니다.

  • 스키마는 중첩 구조가 없는 플랫 JSON 파일이어야 합니다. 예를 들어, 특정 필드는 여러 하위 필드의 부모 필드가 될 수 없습니다.

  • Personalize 스키마는 배열 및 맵과 같은 복잡한 유형을 지원하지 않습니다.

  • 스키마 필드는 고유한 영숫자 이름을 가져야 합니다. 예를 들어, GENRES_FIELD_1필드와 GENRESFIELD1필드를 모두 추가할 수는 없습니다.

  • 필수 필드를 필수 데이터 유형으로 정의해야 합니다. 예약된 범주형 문자열 필드는 categorical속성을 true로 설정해야만 하며, 예약된 문자열 필드는 범주형일 수 없습니다. 키워드는 데이터에 포함될 수 없습니다.

  • 고유 메타데이터 유형 string 필드를 추가하고 교육 시 Amazon Personalize에서 사용하도록 하려면 categorical 속성 또는 textual 속성(항목 스키마는 텍스트 속성이 있는 필드만 지원)을 포함해야 합니다.

  • Amazon Personalize는 테마 생성, 추천의 메타데이터 반환, 추천 필터링 시 항목 이름 열과 같은 비범주형 문자열 열을 사용할 수 있습니다. 자세한 정보는 비범주형 문자열 데이터을 참조하세요.

  • Personalize는 추천을 교육하거나 필터링할 때 boolean유형 데이터를 사용하지 않습니다. Personalize가 교육 또는 필터링 시 부울 데이터를 사용하도록 하려면, 문자열 유형의 필드를 사용하고 데이터에 값 "True""False"를 사용합니다. 또는 int 또는 long 유형과 값 01를 사용할 수 있습니다.

  • 텍스트 필드는 해당 유형 string이어야 하며 textual속성이 true로 설정되어 있어야 합니다. 비정형 텍스트 데이터에 대한 자세한 내용은 비정형 텍스트 메타데이터단원을 참조하세요.

도메인 데이터세트 그룹 데이터세트에는 도메인과 데이터세트 유형에 따른 추가 요구 사항이 있습니다. 사용자 지정 데이터세트 그룹 데이터세트에는 유형에 따라 추가 요구 사항이 있습니다.

스키마 데이터 유형

Personalize 스키마는 필드에 대해 다음과 같은 Avro 유형을 지원합니다.

  • float

  • double

  • int

  • long

  • 문자열

  • boolean

  • null

일부 필수 및 예약 필드는 null 데이터를 지원합니다. 필드에 null유형을 추가하면 불완전한 데이터(예: 값이 비어 있는 메타데이터)를 사용하여 추천을 생성할 수 있습니다. null 데이터를 지원하는 필드에 대한 자세한 내용은 도메인 데이터세트 및 스키마또는 사용자 지정 데이터세트 및 스키마을 참조하세요. 다음 예제에서는 GENDER 필드에 null을 추가하는 방법을 보여 줍니다.

{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }