Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Membuat JSON file skema untuk skema Amazon Personalize
Setelah Anda menyiapkan data Anda, Anda siap untuk membuat JSON file skema untuk setiap jenis data yang Anda impor. File-file ini menguraikan struktur dan konten data Anda, termasuk nama kolom dan tipe datanya.
Anda menggunakan JSON file skema saat membuat skema Amazon Personalize. Membuat skema dan dataset Di Amazon Personalize, skema adalah sumber daya yang memungkinkan Amazon Personalize mengurai data saat Anda mengimpornya ke kumpulan data. Anda membuat skema untuk setiap kumpulan data yang Anda gunakan.
Untuk sumber daya khusus, setiap kumpulan data memiliki persyaratan skema khusus. Untuk grup kumpulan data Domain, domain yang Anda pilih menentukan kumpulan data dan persyaratan skema Anda. Setiap domain memiliki skema default untuk setiap jenis dataset. Saat membuat kumpulan data, Anda dapat menggunakan skema domain yang ada atau membuat yang baru dengan memodifikasi skema default yang ada. Gunakan skema default sebagai panduan untuk data apa yang akan diimpor untuk domain Anda.
Bagian berikut menyediakan persyaratan kustom dan domain untuk membuat JSON file skema untuk setiap jenis dataset.
Topik
Persyaratan pemformatan skema
Saat membuat skema untuk kumpulan data dalam grup kumpulan data Domain atau grup kumpulan data kustom, Anda harus mengikuti panduan berikut:
-
Anda harus menentukan skema dalam format Avro
. Untuk informasi tentang tipe data Avro yang kami dukung, lihatJenis data skema. -
Skema memiliki kunci nama yang nilainya harus cocok dengan tipe dataset.
-
Bidang skema dapat muncul dalam urutan apa pun, tetapi harus sesuai dengan urutan header kolom yang sesuai di file AndaCSV.
-
Skema harus berupa JSON file datar tanpa struktur bersarang. Misalnya, bidang tidak dapat menjadi induk dari beberapa sub-bidang.
-
Skema Amazon Personalize tidak mendukung tipe kompleks seperti array dan peta.
-
Bidang skema harus memiliki nama alfanumerik yang unik. Misalnya, Anda tidak dapat menambahkan
GENRES_FIELD_1
bidang danGENRESFIELD1
bidang. -
Anda harus mendefinisikan bidang wajib sebagai tipe data yang diperlukan. Bidang string kategoris yang dicadangkan harus memiliki
categorical
atribut yang disetel ketrue
, sedangkan bidang string cadangan tidak dapat dikategorikan. Kata kunci tidak bisa ada dalam data Anda. -
Jika Anda menambahkan bidang metadata Anda sendiri dari jenis
string
dan Anda ingin Amazon Personalize menggunakannya saat pelatihan, itu harus menyertakancategorical
atribut atau atribut (hanya skema Itemtextual
yang mendukung bidang dengan atribut tekstual). -
Amazon Personalize tidak menggunakan data
boolean
tipe saat melatih atau memfilter rekomendasi. Agar Amazon Personalisasi menggunakan data boolean saat melatih atau memfilter, gunakan bidang tipe String dan gunakan nilai"True"
dan"False"
data Anda. Atau Anda dapat menggunakan tipe int atau panjang dan nilai0
dan1
. -
Bidang tekstual harus dari tipe
string
dan harus memilikitextual
atribut yang disetel ketrue
. Untuk informasi selengkapnya tentang data teks tidak terstruktur, lihatMetadata teks tidak terstruktur.
Kumpulan data grup kumpulan data domain memiliki persyaratan tambahan berdasarkan jenis domain dan kumpulan data. Kumpulan data grup kumpulan data khusus memiliki persyaratan tambahan tergantung pada jenisnya.
Jenis data skema
Skema Amazon Personalize mendukung jenis Avro berikut untuk bidang:
-
float
-
double
-
int
-
long
-
string
-
boolean
-
null
Beberapa bidang wajib dan cadangan mendukung data nol. Menambahkan null
tipe ke bidang memungkinkan Anda menggunakan data yang tidak sempurna (misalnya, metadata dengan nilai kosong) untuk menghasilkan rekomendasi. Untuk informasi tentang bidang mana yang mendukung data nol, lihat topik persyaratan skema untuk domain Anda:VIDEODEMANDKumpulan data dan skema _ON_,ECOMMERCEdataset dan skema, atau. Kumpulan data dan skema khusus Contoh berikut menunjukkan cara menambahkan tipe null untuk GENDER bidang.
{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }