Persyaratan skema dataset item (kustom) - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Persyaratan skema dataset item (kustom)

Dataset Item menyimpan metadata tentang item Anda di katalog Anda. Ini mungkin termasuk informasi seperti harga, genre, dan ketersediaan untuk setiap item. Untuk informasi tentang jenis data item yang dapat Anda impor ke Amazon Personalize, lihat. Set data item

Data yang Anda berikan untuk setiap item harus cocok dengan skema kumpulan data Item Anda. Minimal, Anda harus memberikan ID Item untuk setiap item (panjang maksimal 256 karakter). Bergantung pada skema Anda, metadata item dapat menyertakan nilai kosong/nol. Skema Anda harus memiliki minimal satu bidang metadata, tetapi jika Anda menambahkan null tipe, nilai ini dapat menjadi nol untuk item tersebut. Anda bebas menambahkan bidang tambahan tergantung pada kasus penggunaan dan data Anda. Selama bidang tidak terdaftar sebagai wajib atau dicadangkan, dan tipe data dicantumkanJenis data skema, nama bidang dan tipe data terserah Anda.

Untuk menggunakan data kategoris, tambahkan bidang tipe string dan setel atribut kategoris bidang ke true dalam skema Anda. Kemudian sertakan data kategoris dalam file CSV massal Anda dan impor item individual. Nilai kategoris dapat memiliki paling banyak 1000 karakter. Jika Anda memiliki item dengan nilai kategoris dengan lebih dari 1000 karakter, pekerjaan impor dataset Anda akan gagal.

Untuk item dengan beberapa kategori, pisahkan setiap nilai dengan bilah vertikal, '|'. Misalnya, untuk bidang GENRES, data Anda untuk item mungkinAction|Crime|Biopic. Jika Anda memiliki beberapa level data kategoris dan beberapa item memiliki beberapa kategori untuk setiap level dalam hierarki, tambahkan bidang untuk setiap level dan tambahkan indikator level setelah setiap nama bidang: GENRES, GENRE_L2, GENRE_L3. Ini memungkinkan Anda memfilter rekomendasi berdasarkan sub-kategori, bahkan jika item termasuk dalam beberapa kategori multi-level (untuk informasi tentang membuat dan menggunakan filter lihatMemfilter rekomendasi dan segmen pengguna). Misalnya, video mungkin memiliki data berikut untuk setiap tingkat kategori:

  • GENRE: Aksi|Petualangan

  • GENRE_L2: Kejahatan|Barat

  • GENRE_L3: Biopik

Dalam contoh ini, video berada dalam hierarki aksi> kriminal> biopik dan hierarki biopik petualangan> barat>. Kami merekomendasikan hanya menggunakan hingga L3 tetapi Anda dapat menggunakan lebih banyak level jika perlu.

Selama pelatihan model, Amazon Personalize mempertimbangkan maksimum 750.000 item. Jika Anda mengimpor lebih dari 750.000 item, Amazon Personalize memutuskan item mana yang akan disertakan dalam pelatihan, dengan penekanan pada menyertakan item baru (item yang baru-baru ini Anda tambahkan tanpa interaksi) dan item yang ada dengan data interaksi terbaru.

Untuk informasi selengkapnya tentang persyaratan minimum dan batas data maksimum untuk kumpulan data Item, lihatKuota layanan.

Contoh skema kumpulan data item (kustom)

Contoh berikut menunjukkan bagaimana menyusun skema Item. Bidang ITEM_ID wajib diisi. GENREBidang adalah metadata kategoris dan DESCRIPTION bidangnya adalah metadata tekstual. Setidaknya diperlukan satu bidang metadata. Anda dapat menambahkan maksimal 100 bidang metadata. CREATION_TIMESTAMPBidang adalah kata kunci yang dicadangkan. Untuk informasi tentang persyaratan skema, lihatDataset kustom dan persyaratan skema.

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true } ], "version": "1.0" }

Untuk skema ini, beberapa baris pertama data historis dalam file CSV mungkin terlihat seperti berikut.

ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION 1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004." 2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010." 3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women." 4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020." ... ...