Resep SIMS - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Resep SIMS

catatan

Semua resep RELATED_ITEMS menggunakan data interaksi. Pilih SIMS jika Anda ingin mengonfigurasi lebih banyak hyperparameters untuk model. Pilih metadata item Resep Barang Serupa jika Anda memiliki dan ingin Amazon Personalize menggunakannya untuk menemukan item serupa.

Resep I tem-to-item similarities (SIMS) menggunakan pemfilteran kolaboratif untuk merekomendasikan item yang paling mirip dengan item yang Anda tentukan saat Anda mendapatkan rekomendasi. SIMS menggunakan kumpulan data interaksi Item Anda, bukan metadata item seperti warna atau harga, untuk menentukan kesamaan. SIMS mengidentifikasi kemunculan bersama item dalam riwayat pengguna di kumpulan data Interaksi Anda untuk merekomendasikan item serupa. Misalnya, dengan SIMS Amazon Personalize dapat merekomendasikan item kedai kopi yang sering dibeli pelanggan bersama atau film yang juga ditonton pengguna yang berbeda.

Saat Anda mendapatkan rekomendasi item serupa, Anda dapat memfilter item berdasarkan atribut item yang Anda tentukan dalam permintaan Anda. Anda melakukan ini dengan menambahkanCurrentItem. attributeelemen ke filter Anda. Lihat contohnya di item data filter examples.

Untuk menggunakan SIMS, Anda harus membuat kumpulan data interaksi Item dengan setidaknya 1000 interaksi historis dan peristiwa unik (gabungan). SIMS tidak menggunakan data dalam kumpulan data Pengguna atau Item saat membuat rekomendasi. Anda masih dapat memfilter rekomendasi berdasarkan data dalam kumpulan data ini. Untuk informasi selengkapnya, lihat Memfilter rekomendasi dan segmen pengguna.

Jika tidak ada data perilaku pengguna yang cukup untuk item atau ID item yang Anda berikan tidak ditemukan, SIMS merekomendasikan item populer. Setelah Anda membuat versi solusi, pastikan Anda selalu memperbarui versi dan data solusi Anda. Dengan SIMS, Anda harus secara manual membuat versi solusi baru (melatih ulang model) untuk Amazon Personalize untuk mempertimbangkan item baru untuk rekomendasi dan memperbarui model dengan perilaku terbaru pengguna Anda. Maka Anda harus memperbarui kampanye apa pun menggunakan versi solusi. Untuk informasi selengkapnya, lihat Mempertahankan relevansi rekomendasi.

Resep SIMS memiliki sifat-sifat berikut:

  • Namaaws-sims

  • Resep Nama Sumber Daya Amazon (ARN) — arn:aws:personalize:::recipe/aws-sims

  • Algoritma ARNarn:aws:personalize:::algorithm/aws-sims

  • Transformasi fitur ARNarn:aws:personalize:::feature-transformation/sims

  • Jenis resepRELATED_ITEMS

Tabel berikut menjelaskan hiperparameter untuk resep SIMS. Hyperparameter adalah parameter algoritma yang dapat Anda sesuaikan untuk meningkatkan kinerja model. Algoritma hyperparameters mengontrol bagaimana kinerja model. Hyperparameter featurisasi mengontrol cara memfilter data yang akan digunakan dalam pelatihan. Proses memilih nilai terbaik untuk hyperparameter disebut optimasi hyperparameter (HPO). Untuk informasi selengkapnya, lihat Hyperparameters dan HPO.

Tabel ini juga menyediakan informasi berikut untuk setiap hyperparameter:

  • Rentang: [batas bawah, batas atas]

  • Jenis nilai: Integer, Continuous (float), Kategoris (Boolean, daftar, string)

  • HPO tunable: Dapatkah parameter berpartisipasi dalam optimasi hyperparameter (HPO)?

Nama Penjelasan
Hiperparameter algoritma
popularity_discount_factor

Konfigurasikan bagaimana popularitas memengaruhi rekomendasi. Tentukan nilai yang mendekati nol untuk memasukkan item yang lebih populer. Tentukan nilai yang lebih dekat dengan nilai untuk kurang menekankan pada popularitas.

Nilai default: 0,5

Rentang: [0.0, 1.0]

Jenis nilai: Float

HPO dapat disetel: Ya

min_cointeraction_count

Jumlah minimum interaksi bersama yang Anda butuhkan untuk menghitung kesamaan antara sepasang item. Misalnya, nilai 3 berarti Anda memerlukan tiga atau lebih pengguna yang berinteraksi dengan kedua item agar algoritme menghitung kesamaannya.

Nilai default: 3

Rentang: [0, 10]

Jenis nilai: Integer

HPO dapat disetel: Ya

Hiperparameter featurisasi
min_user_history_length_percentile

Persentil minimum panjang riwayat pengguna untuk dimasukkan dalam pelatihan model. Panjang riwayat adalah jumlah total data yang tersedia pada pengguna. Gunakan min_user_history_length_percentile untuk mengecualikan persentase pengguna dengan panjang riwayat pendek. Pengguna dengan riwayat singkat sering menunjukkan pola berdasarkan popularitas item, bukan kebutuhan atau keinginan pribadi pengguna. Menghapusnya dapat melatih model dengan lebih fokus pada pola yang mendasarinya dalam data Anda. Pilih nilai yang sesuai setelah Anda meninjau panjang riwayat pengguna, menggunakan histogram atau alat serupa. Kami merekomendasikan untuk menyetel nilai yang mempertahankan mayoritas pengguna, tetapi menghapus kasus tepi.

Nilai default: 0,005

Rentang: [0.0, 1.0]

Jenis nilai: Float

HPO dapat disetel: Tidak

max_user_history_length_percentile

Persentil maksimum panjang riwayat pengguna untuk dimasukkan dalam pelatihan model. Panjang riwayat adalah jumlah total data yang tersedia pada pengguna. Gunakan max_user_history_length_percentile untuk mengecualikan persentase pengguna dengan panjang sejarah panjang. Pengguna dengan sejarah panjang cenderung mengandung kebisingan. Misalnya, robot mungkin memiliki daftar panjang interaksi otomatis. Menghapus pengguna ini membatasi kebisingan dalam pelatihan. Pilih nilai yang sesuai setelah Anda meninjau panjang riwayat pengguna menggunakan histogram atau alat serupa. Kami merekomendasikan untuk menyetel nilai yang mempertahankan mayoritas pengguna tetapi menghapus kasus tepi.

Misalnya, min_hist_length_percentile = 0.05 dan max_hist_length_percentile = 0.95 mencakup semua pengguna kecuali yang memiliki panjang riwayat di bagian bawah atau atas 5%.

Nilai default: 0,995

Rentang: [0.0, 1.0]

Jenis nilai: Float

HPO dapat disetel: Tidak

min_item_interaction_count_percentile

Persentil minimum interaksi item diperhitungkan untuk dimasukkan dalam pelatihan model. Gunakan min_item_interaction_count_percentile untuk mengecualikan persentase item dengan riwayat interaksi singkat. Item dengan sejarah singkat sering kali merupakan item baru. Menghapusnya dapat melatih model dengan lebih fokus pada item dengan riwayat yang diketahui. Pilih nilai yang sesuai setelah Anda meninjau panjang riwayat pengguna, menggunakan histogram atau alat serupa. Kami merekomendasikan untuk menyetel nilai yang mempertahankan sebagian besar item, tetapi menghapus kasus tepi.

Nilai default: 0,01

Rentang: [0.0, 1.0]

Jenis nilai: Float

HPO dapat disetel: Tidak

max_item_interaction_count_percentile

Persentil maksimum interaksi item diperhitungkan untuk dimasukkan dalam pelatihan model. Gunakan max_item_interaction_count_percentile untuk mengecualikan persentase item dengan riwayat interaksi yang panjang. Item dengan sejarah panjang cenderung lebih tua dan mungkin sudah ketinggalan zaman. Misalnya, rilis film yang tidak dicetak. Menghapus item ini dapat fokus pada item yang lebih relevan. Pilih nilai yang sesuai setelah Anda meninjau panjang riwayat pengguna menggunakan histogram atau alat serupa. Kami merekomendasikan untuk menyetel nilai yang mempertahankan sebagian besar item tetapi menghapus kasus tepi.

Misalnya, min_item_interaction_count_percentile = 0.05 dan max_item_interaction_count_percentile = 0.95 mencakup semua item kecuali yang memiliki jumlah interaksi di bagian bawah atau atas 5%.

Nilai default: 0,9

Rentang: [0.0, 1.0]

Jenis nilai: Float

HPO dapat disetel: Tidak

Notebook sampel SIMS

Untuk contoh buku catatan Jupyter yang menunjukkan cara menggunakan resep SIMS, lihat Menemukan item serupa+ HPO.