Menghapus pengguna dan data mereka dengan pekerjaan penghapusan data - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menghapus pengguna dan data mereka dengan pekerjaan penghapusan data

Setelah mengimpor data, Anda dapat menghapus pengguna dan datanya, termasuk metadata dan data interaksinya, dari grup kumpulan data. Anda dapat menghapus data pengguna sebagai bagian dari program kepatuhan, atau untuk mengatasi permintaan penghapusan pengguna, atau untuk menjaga data Anda tetap terkini saat basis pengguna Anda berubah.

Setelah Anda menghapus pengguna, Amazon Personalize tidak lagi melatih data mereka dan tidak lagi mempertimbangkan pengguna saat membuat segmen pengguna.

Untuk menghapus referensi ke pengguna di Amazon Personalisasi kumpulan data dan model dalam grup kumpulan data, Anda melakukan hal berikut:

  1. Siapkan file CSV yang mencantumkan userIds pengguna yang akan dihapus di kolom USER_ID.

  2. Unggah file CSV ke bucket Amazon S3. Peran layanan Personalisasi Amazon Anda harus memiliki izin untuk mengakses bucket ini.

  3. Buat pekerjaan penghapusan data. Pekerjaan penghapusan data adalah pekerjaan batch yang menghapus pengguna dan data mereka dari model dan kumpulan data dalam grup dataset.

Pedoman dan persyaratan

Berikut ini adalah pedoman dan persyaratan untuk menghapus pengguna:

  • Sebelum Anda membuat pekerjaan penghapusan data, pastikan tidak ada pekerjaan yang menggunakan kumpulan data Anda yang sedang berlangsung, seperti pekerjaan pelatihan, pekerjaan batch, atau operasi impor massal atau individual. Dan hindari membuat pekerjaan seperti itu saat pekerjaan penghapusan data sedang berlangsung. Jika ada pelatihan atau impor yang terjadi, kami tidak dapat menjamin bahwa data pengguna akan dihapus dari model dan kami sarankan untuk membuat pekerjaan penghapusan data tambahan.

  • Pekerjaan penghapusan data tidak menghapus referensi ke pengguna di luar Amazon Personalize. Misalnya, UserID tidak dihapus dari rekomendasi batch di bucket Amazon S3 Anda. Anda harus menghapus catatan ini secara manual.

  • Anda dapat memiliki hingga 5 pekerjaan penghapusan untuk grup kumpulan data dengan status PENDING.

  • Ukuran total maksimum file input penghapusan data atau file Anda adalah 50 MB. Anda dapat menggunakan kembali file input yang sama saat Anda membuat pekerjaan penghapusan.

  • Setiap pekerjaan penghapusan data menghapus pengguna dan data interaksi mereka dalam grup kumpulan data. Untuk menghapus datanya di semua grup kumpulan data, Anda harus membuat pekerjaan penghapusan data untuk setiap grup kumpulan data.

  • Setelah Anda membuat pekerjaan, diperlukan waktu hingga satu hari untuk menghapus data pengguna dari kumpulan data dan model.

  • Setelah pekerjaan selesai, pastikan untuk memperbarui sumber daya khusus apa pun. Pastikan untuk membuat versi solusi baru dan, jika perlu, perbarui kampanye Anda. Jika Anda menggunakan pelatihan otomatis, Anda masih dapat membuat versi solusi baru secara manual.

  • Peran layanan Personalisasi Amazon Anda harus memiliki izin untuk mengakses bucket Amazon S3 Anda dengan daftar pengguna yang akan dihapus. Kebutuhan GetObject dan ListBucket izin untuk ember dan kontennya. Izin ini sama dengan mengimpor data. Untuk informasi tentang pemberian izin dan contoh kebijakan, lihat. Memberikan Amazon Personalisasi akses ke sumber daya Amazon S3

  • Anda tidak dapat menggunakan AWS Key Management Service kunci Anda sendiri di bucket Amazon S3 yang menyimpan daftar UserIds pengguna untuk dihapus.

  • Jika item hanya muncul di kumpulan data kumpulan data interaksi Item Anda dan hanya pengguna yang Anda hapus yang berinteraksi dengan item ini, item ini tidak akan lagi muncul di rekomendasi.

Mempersiapkan daftar pengguna untuk dihapus

Sebelum menghapus pengguna dari Amazon Personalize, Anda harus menyiapkan daftar pengguna untuk dihapus dalam file CSV dan mengunggahnya ke Amazon S3.

Untuk mempersiapkan daftar pengguna untuk menghapus dan mengunggahnya
  1. Buat file CSV yang mencantumkan userIds pengguna yang akan dihapus. Berikut ini menunjukkan bagaimana file CSV Anda harus diformat.

    USER_ID abc 2a 5basc ab35 123f a55d 0v22 441fa efg
  2. Unggah file CSV Anda ke bucket Amazon Simple Storage Service (Amazon S3). Untuk informasi selengkapnya tentang mengunggah file ke Amazon S3, lihat Mengunggah File dan Folder dengan Menggunakan Seret dan Jatuhkan di Panduan Pengguna Layanan Penyimpanan Sederhana Amazon.

  3. Berikan Amazon Personalize akses ke bucket dan file CSV Anda. Amazon Personalize harus memiliki izin untuk melakukan GetObject dan ListBucket Tindakan pada bucket Anda dan isinya. Izin ini sama dengan mengimpor data. Untuk informasi tentang pemberian izin dan contoh kebijakan, lihat. Memberikan Amazon Personalisasi akses ke sumber daya Amazon S3

Membuat pekerjaan penghapusan data

Setelah selesaiMempersiapkan daftar pengguna untuk dihapus, Anda siap untuk menghapus pengguna dengan pekerjaan penghapusan data.

Pekerjaan penghapusan data adalah pekerjaan batch yang menghapus pengguna dan data mereka dari model dan kumpulan data dalam grup dataset. Setelah Anda menghapus pengguna, Amazon Personalize tidak lagi melatih data mereka dan tidak lagi mempertimbangkan pengguna saat membuat segmen pengguna.

Saat membuat pekerjaan penghapusan data, Anda menentukan lokasi Amazon S3 dari daftar pengguna yang akan dihapus.

  • Jika data Anda dalam satu file, gunakan sintaks berikut untuk lokasi Amazon S3:

    s3://<name of your S3 bucket>/<folder path>/<CSV filename>.csv

  • Jika file CSV Anda berada di folder di bucket Amazon S3, Anda dapat menentukan jalur ke folder tersebut. Dengan pekerjaan penghapusan data, Amazon Personalize menggunakan semua file dengan ekstensi file .csv di folder dan sub folder apa pun. Ini mengabaikan file dari jenis lain. Gunakan sintaks berikut dengan nama folder / setelah:

    s3://<name of your S3 bucket>/<folder path>/

Peran yang Anda gunakan harus memiliki izin untuk melakukan GetObject dan ListBucket Tindakan di bucket Amazon S3 Anda dan isinya. Untuk informasi tentang pemberian izin dan contoh kebijakan, lihat. Memberikan Amazon Personalisasi akses ke sumber daya Amazon S3

Anda dapat membuat tugas penghapusan data dengan konsol Amazon Personalize,AWS CLI(), atau AWS Command Line Interface SDK. AWS

Untuk menghapus pengguna dengan konsol Amazon Personalize, buat tugas penghapusan data dengan nama, peran layanan IAM, dan lokasi Amazon S3 data Anda.

Untuk menghapus catatan (konsol)
  1. Buka konsol Amazon Personalize di https://console.aws.amazon.com/personalize/home dan masuk ke akun Anda.

  2. Pada halaman grup Dataset, pilih grup kumpulan data Anda. Ikhtisar grup kumpulan data ditampilkan.

  3. Di panel navigasi, pilih Datasets.

  4. Dalam pekerjaan penghapusan data, pilih Buat pekerjaan.

  5. Dalam rincian Job, beri nama pekerjaan itu.

  6. Di sumber Input S3, untuk Lokasi S3, tentukan lokasi Amazon S3 dari file CSV yang menyimpan daftar userIds pengguna yang akan dihapus. Anda menyiapkan file ini diMempersiapkan daftar pengguna untuk dihapus.

  7. Dalam peran IAM, pilih untuk membuat peran baru atau menggunakan yang sudah ada. Jika Anda menyelesaikan prasyarat untuk membuat peran untuk Amazon Personalisasi dan memberikan akses peran ini ke bucket Amazon S3, pilih Gunakan peran layanan yang ada dan tentukan peran yang Anda buat. Membuat peran IAM untuk Amazon Personalize

    Peran yang Anda gunakan harus memiliki izin untuk melakukan GetObject dan ListBucket Tindakan di bucket Amazon S3 Anda dan isinya. Izin ini sama dengan mengimpor data. Untuk informasi tentang pemberian izin dan contoh kebijakan, lihat. Memberikan Amazon Personalisasi akses ke sumber daya Amazon S3

  8. Untuk Tag, secara opsional tambahkan tag apa pun. Untuk informasi selengkapnya tentang menandai sumber daya Amazon Personalize, lihat. Menandai Amazon Personalisasi sumber daya

  9. Pilih Buat tugas. Pekerjaan dimulai dan halaman detail ditampilkan.

    Setelah Anda membuat pekerjaan, itu bisa sekitar satu hari untuk menghapus data pengguna dari kumpulan data dan model. Sampai pekerjaan selesai, Amazon Personalize terus menggunakan data saat pelatihan. Dan pengguna mungkin muncul di segmen pengguna.

    Penghapusan data selesai ketika status ditampilkan sebagai SELESAI. Jika pekerjaan gagal karena alasan apa pun, sebaiknya buat pekerjaan penghapusan data lainnya. Setelah pekerjaan selesai, pastikan untuk memperbarui sumber daya khusus apa pun. Pastikan untuk membuat versi solusi baru dan, jika perlu, perbarui kampanye Anda. Jika Anda menggunakan pelatihan otomatis, Anda masih dapat membuat versi solusi baru secara manual.

Untuk menghapus pengguna dengan AWS CLI, gunakan create-data-deletion-job perintah. Perintah ini menggunakan operasi CreateDataDeletion API. Kode berikut menunjukkan cara membuat pekerjaan penghapusan data. Untuk menggunakan kode, perbarui kode tersebut untuk menentukan nama pekerjaan, peran IAM yang Anda buatMembuat peran IAM untuk Amazon Personalize, dan lokasi Amazon S3 data Anda. Anda menyiapkan file ini diMempersiapkan daftar pengguna untuk dihapus.

aws personalize create-data-deletion-job \ --job-name deletion job name \ --dataset-group-arn dataset group ARN \ --data-source dataLocation=s3://bucketname/filename.csv \ --role-arn roleArn

Setelah Anda membuat pekerjaan, itu bisa sekitar satu hari untuk menghapus data pengguna dari kumpulan data dan model. Sampai pekerjaan selesai, Amazon Personalize terus menggunakan data saat pelatihan. Dan pengguna mungkin muncul di segmen pengguna.

Pekerjaan selesai ketika status selesai. Periksa status dengan menggunakan describe-data-deletion-job perintah dan tentukan pekerjaan penghapusan data ARN. Untuk informasi selengkapnya tentang operasi API, lihatDescribeDataDeletionJob. Untuk melihat riwayat pekerjaan penghapusan data yang diurutkan berdasarkan waktu pembuatan, gunakan operasi API. ListDataDeletionJobs

Jika pekerjaan gagal karena alasan apa pun, sebaiknya buat pekerjaan penghapusan data lainnya. Setelah pekerjaan selesai, pastikan untuk memperbarui sumber daya khusus apa pun. Pastikan untuk membuat versi solusi baru dan, jika perlu, perbarui kampanye Anda. Jika Anda menggunakan pelatihan otomatis, Anda masih dapat membuat versi solusi baru secara manual.

Untuk menghapus pengguna dengan AWS SDK, gunakan operasi CreateDataDeletionJob API. Kode berikut menunjukkan cara membuat pekerjaan penghapusan data. Untuk menggunakan kode, perbarui kode tersebut untuk menentukan nama pekerjaan, peran IAM yang Anda buatMembuat peran IAM untuk Amazon Personalize, dan lokasi Amazon S3 data Anda. Anda menyiapkan file ini diMempersiapkan daftar pengguna untuk dihapus.

import boto3 personalize = boto3.client('personalize') response = personalize.create_data_deletion_job( jobName = 'Deletion job name', datasetGroupArn = 'Dataset Group ARN', dataSource = {'dataLocation':'s3://bucket/file.csv'}, roleArn = 'role_arn' ) deletion_job_arn = response['dataDeletionJobArn'] print ('Deletion Job arn: ' + deletion_job_arn) description = personalize.describe_data_deletion_job( dataDeletionJobArn = deletion_job_arn)['dataDeletionJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['dataDeletionJobArn']) print('Status: ' + description['status'])

Setelah Anda membuat pekerjaan, itu bisa sekitar satu hari untuk menghapus data pengguna dari kumpulan data dan model. Sampai pekerjaan selesai, Amazon Personalize terus menggunakan data saat pelatihan. Dan pengguna mungkin muncul di segmen pengguna.

Pekerjaan selesai ketika status selesai. Periksa status dengan menggunakan DescribeDataDeletionJob operasi dan tentukan pekerjaan penghapusan data ARN. Untuk melihat riwayat pekerjaan penghapusan data yang diurutkan berdasarkan waktu pembuatan, gunakan operasi API. ListDataDeletionJobs

Jika pekerjaan gagal karena alasan apa pun, sebaiknya buat pekerjaan penghapusan data lainnya. Setelah pekerjaan selesai, pastikan untuk memperbarui sumber daya khusus apa pun. Pastikan untuk membuat versi solusi baru dan, jika perlu, perbarui kampanye Anda. Jika Anda menggunakan pelatihan otomatis, Anda masih dapat membuat versi solusi baru secara manual.