Skema - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Skema

Skema memberi tahu Amazon Personalize tentang struktur data Anda dan memungkinkan Amazon Personalize untuk mengurai data. Skema memiliki kunci nama yang nilainya harus cocok dengan tipe dataset. Setelah Anda membuat skema, Anda tidak dapat membuat perubahan pada skema.

Untuk grup kumpulan data Domain, setiap jenis kumpulan data memiliki skema default dengan bidang wajib dan kata kunci yang dicadangkan. Setiap kali Anda membuat kumpulan data, Anda dapat menggunakan skema domain yang ada atau membuat yang baru dengan memodifikasi skema default yang ada. Gunakan skema default sebagai panduan untuk data apa yang akan diimpor untuk domain Anda. Setelah Anda menentukan skema dan membuat kumpulan data, Anda tidak dapat membuat perubahan pada skema.

Persyaratan pemformatan skema

Saat membuat skema untuk kumpulan data dalam grup kumpulan data Domain atau grup kumpulan data kustom, Anda harus mengikuti panduan berikut:

  • Anda harus menentukan skema dalam format Avro. Untuk informasi tentang tipe data Avro yang kami dukung, lihatJenis data skema.

  • Bidang skema dapat muncul dalam urutan apa pun, tetapi harus sesuai dengan urutan header kolom yang sesuai dalam file CSV Anda.

  • Skema harus berupa file JSON datar tanpa struktur bersarang. Misalnya, bidang tidak dapat menjadi induk dari beberapa sub-bidang.

  • Skema Amazon Personalize tidak mendukung tipe kompleks seperti array dan peta.

  • Bidang skema harus memiliki nama alfanumerik yang unik. Misalnya, Anda tidak dapat menambahkan GENRES_FIELD_1 bidang dan GENRESFIELD1 bidang.

  • Anda harus mendefinisikan bidang wajib sebagai tipe data yang diperlukan. Bidang string kategoris yang dicadangkan harus memiliki categorical atribut yang disetel ketrue, sedangkan bidang string cadangan tidak dapat dikategorikan. Kata kunci tidak bisa ada dalam data Anda.

  • Jika Anda menambahkan bidang metadata Anda sendiri dari jenis string dan Anda ingin Amazon Personalize menggunakannya saat pelatihan, itu harus menyertakan categorical atribut atau atribut (hanya skema Item textual yang mendukung bidang dengan atribut tekstual).

  • Amazon Personalize dapat menggunakan kolom string non-kategoris, seperti kolom nama item, saat membuat tema, mengembalikan metadata dalam rekomendasi, dan memfilter rekomendasi. Untuk informasi selengkapnya, lihat Data string non-kategoris.

  • Amazon Personalize tidak menggunakan data boolean tipe saat melatih atau memfilter rekomendasi. Agar Amazon Personalisasi menggunakan data boolean saat melatih atau memfilter, gunakan bidang tipe String dan gunakan nilai "True" dan "False" data Anda. Atau Anda dapat menggunakan tipe int atau panjang dan nilai 0 dan1.

  • Bidang tekstual harus dari tipe string dan harus memiliki textual atribut yang disetel ketrue. Untuk informasi selengkapnya tentang data teks tidak terstruktur, lihatMetadata teks tidak terstruktur.

Kumpulan data grup kumpulan data domain memiliki persyaratan tambahan berdasarkan jenis domain dan kumpulan data. Kumpulan data grup kumpulan data khusus memiliki persyaratan tambahan tergantung pada jenisnya.

Jenis data skema

Skema Amazon Personalize mendukung jenis Avro berikut untuk bidang:

  • float

  • double

  • int

  • long

  • string

  • boolean

  • null

Beberapa bidang wajib dan cadangan mendukung data nol. Menambahkan null tipe ke bidang memungkinkan Anda menggunakan data yang tidak sempurna (misalnya, metadata dengan nilai kosong) untuk menghasilkan rekomendasi. Untuk informasi tentang bidang mana yang mendukung data nol, lihat Kumpulan data dan skema domain atauKumpulan data dan skema khusus. Contoh berikut menunjukkan cara menambahkan tipe null untuk bidang GENDER.

{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }