Mengganti skema dataset untuk menambahkan kolom baru - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengganti skema dataset untuk menambahkan kolom baru

Setelah membuat kumpulan data Item atau Pengguna, Anda dapat mengganti skema dengan yang baru atau yang sudah ada. Anda dapat mengganti skema kumpulan data jika struktur data Anda berubah setelah Anda membuat kumpulan data. Misalnya, Anda mungkin memiliki kolom metadata item baru yang ingin dipertimbangkan Amazon Personalize selama pelatihan. Atau Anda mungkin ingin menambahkan kolom data untuk digunakan hanya saat memfilter rekomendasi.

Saat mengganti skema kumpulan data, Anda harus menyimpan semua bidang dalam skema sebelumnya dan Anda tidak dapat mengubah tipe atau atribut datanya. Setelah Anda mengganti skema kumpulan data, Amazon Personalize secara otomatis mengecualikan kolom baru apa pun dari pelatihan untuk rekomendasi atau solusi khusus yang ada. Untuk panduan dan persyaratan lebih lanjut, lihatPedoman dan persyaratan.

Anda dapat mengganti skema kumpulan data dengan konsol Amazon Personalize AWS Command Line Interface ,AWS CLI(), dan SDK. AWS

Pedoman dan persyaratan

Sebelum Anda mengganti skema untuk kumpulan data, pastikan Anda mengetahui pedoman dan persyaratan berikut:

  • Anda tidak dapat mengganti skema kumpulan data interaksi Item, kumpulan data interaksi tindakan, atau kumpulan data Tindakan.

  • Anda dapat menambahkan bidang baru ke skema pengganti Anda, tetapi Anda harus menyimpan semua bidang dalam skema sebelumnya. Dan Anda tidak dapat mengubah tipe atau atribut data mereka. Misalnya, jika skema sebelumnya menyertakan MEMBERSHIP_STATUS bidang untuk data string kategoris, skema baru yang Anda gunakan harus menyertakan MEMBERSHIP_STATUS bidang dengan atribut dan tipe data ini.

  • Jika skema saat ini memiliki bidang yang ingin Anda ganti namanya, atau jika Anda ingin mengubah tipe atau atribut datanya, Anda dapat menambahkan bidang baru dengan nama baru dan jenis atau atribut yang dimodifikasi. Kemudian sertakan bidang baru dalam pelatihan dan kecualikan bidang lama. Setiap bidang baru harus mendukung null data. Jika bidang lama tidak mendukung data null, saat Anda mengimpor data, Anda dapat menggunakan data placeholder untuk memastikan impor Anda cocok dengan skema. Untuk informasi tentang mengonfigurasi kolom yang digunakan oleh pemberi rekomendasi, lihat. Memperbarui seorang pemberi rekomendasi Untuk informasi tentang mengonfigurasi kolom yang digunakan oleh solusi, lihatMengkonfigurasi kolom yang digunakan saat pelatihan.

  • Setiap bidang baru harus mendukung null data. Untuk informasi tentang menambahkan tipe null ke bidang, lihatJenis data skema.

  • Setelah Anda mengganti skema kumpulan data, Amazon Personalize secara otomatis mengecualikan kolom baru apa pun dari pelatihan untuk rekomendasi atau solusi khusus yang ada. Menggunakan dataset yang dimodifikasi melibatkan tindakan berikut:

    • Untuk menggunakan kolom baru apa pun dalam pelatihan, impor data yang selaras dengan skema baru. Kemudian perbarui rekomendasi apa pun untuk menggunakan kolom baru, atau buat solusi khusus baru dan konfigurasikan kolom yang digunakannya saat pelatihan.

      Untuk informasi tentang memperbarui kolom yang digunakan oleh pemberi rekomendasi, lihatMemperbarui seorang pemberi rekomendasi. Untuk informasi tentang mengonfigurasi kolom yang digunakan oleh solusi, lihatMengkonfigurasi kolom yang digunakan saat pelatihan.

    • Untuk menggunakan kolom apa pun hanya saat memfilter, impor data yang sejajar dengan skema baru, buat filter yang menggunakan data baru, dan terapkan filter Anda ke permintaan rekomendasi Anda. Anda tidak perlu memperbarui pemberi rekomendasi apa pun, atau membuat atau memperbarui sumber daya khusus apa pun.

Mengganti skema kumpulan data (konsol)

Untuk mengganti skema kumpulan data dengan konsol Amazon Personalize, Anda memilih kumpulan data yang akan dimodifikasi dan memilih untuk mengganti dengan skema baru atau menggunakan skema yang sudah ada.

Untuk mengganti skema dataset
  1. Buka konsol Amazon Personalize di https://console.aws.amazon.com/personalize/home dan masuk ke akun Anda.

  2. Pada halaman grup Dataset, pilih grup kumpulan data Anda.

  3. Di panel navigasi, pilih Datasets, dan pilih tombol radio untuk dataset yang ingin Anda modifikasi.

  4. Pilih Tindakan, dan pilih Ganti skema.

  5. Dalam detail Skema, pilih untuk mengganti dengan skema baru atau skema yang dibuat sebelumnya.

  6. Tentukan skema baru yang akan digunakan. Jika Anda telah memilih untuk:

    • Ganti dengan skema baru, lalu beri nama skema, dan dalam definisi Skema, buat perubahan Anda pada skema JSON.

    • Gunakan skema yang dibuat sebelumnya, lalu untuk skema yang dibuat sebelumnya, pilih skema yang ingin Anda gunakan. Hanya skema yang memenuhi syarat yang terdaftar. Untuk informasi tentang persyaratan skema, lihatPedoman dan persyaratan.

  7. Pilih Ganti. Saat kumpulan data aktif, Anda dapat mulai mengimpor data yang selaras dengan skema baru. Untuk informasi selengkapnya, lihat Langkah 2: Mempersiapkan dan mengimpor data.

Mengganti skema () kumpulan data AWS CLI

Untuk mengganti skema kumpulan data dengan AWS CLI, Anda menggunakan update-dataset perintah, tentukan Nama Sumber Daya Amazon (ARN) dari kumpulan data yang akan diperbarui dan ARN skema baru yang akan digunakan. Anda tidak dapat memperbarui skema kumpulan data interaksi Item, kumpulan data interaksi tindakan, atau kumpulan data Tindakan.

Kode berikut menunjukkan cara memperbarui skema kumpulan data dengan. AWS CLI Untuk mengganti skema dataset dengan yang baru, pertama-tama gunakan perintah. create-schema Kemudian gunakan kode berikut untuk mengganti skema saat ini dengan yang baru. Untuk informasi tentang membuat skema dengan AWS CLI, lihatMembuat dataset dan skema ()AWS CLI. Untuk informasi tentang kumpulan data dan persyaratan skema, lihat. Skema

aws personalize update-dataset \ --dataset-arn Dataset ARN \ --schema-arn New schema ARN

Saat kumpulan data aktif, Anda dapat mulai mengimpor data yang selaras dengan skema baru. Untuk informasi selengkapnya, lihat Langkah 2: Mempersiapkan dan mengimpor data. Untuk informasi tentang pembaruan terbaru ke kumpulan data, Anda dapat menggunakan DescribeDataset operasi.

Mengganti skema kumpulan data (SDK)AWS

Untuk mengganti skema kumpulan data dengan AWS SDK, Anda menggunakan operasi API. UpdateDataset Tentukan Nama Sumber Daya Amazon (ARN) dari kumpulan data yang akan diperbarui dan skema baru yang akan digunakan. Anda tidak dapat memperbarui skema kumpulan data interaksi Item, kumpulan data interaksi tindakan, atau kumpulan data Tindakan.

Kode berikut menunjukkan cara mengganti skema dataset dengan SDK for Python (Boto3). Untuk mengganti skema dataset dengan yang baru, pertama gunakan operasi. CreateSchema Kemudian gunakan kode berikut untuk mengganti skema saat ini dengan yang baru. Untuk informasi tentang membuat skema dengan AWS SDK, lihat. Membuat kumpulan data dan skema (SDK)AWS Untuk informasi tentang set data dan persyaratan skema, lihat. Skema

import boto3 personalize = boto3.client('personalize') update_dataset_response = personalize.update_dataset( datasetArn = 'dataset_arn', schemaArn = 'new_schema_arn' ) print(update_dataset_response)

Saat kumpulan data aktif, Anda dapat mulai mengimpor data yang selaras dengan skema baru. Untuk informasi selengkapnya, lihat Langkah 2: Mempersiapkan dan mengimpor data. Untuk informasi tentang pembaruan terbaru ke kumpulan data, Anda dapat menggunakan DescribeDataset operasi.