Menghasilkan visualisasi dan wawasan data - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menghasilkan visualisasi dan wawasan data

Setelah mengimpor data ke Data Wrangler, Anda dapat menggunakannya untuk menghasilkan visualisasi dan wawasan data.

  • Visualisasi: Data Wrangler dapat menghasilkan berbagai jenis grafik, seperti histogram dan plot pencar. Misalnya, Anda dapat membuat histogram untuk mengidentifikasi outlier dalam data Anda.

  • Wawasan data: Anda dapat menggunakan Laporan Kualitas Data dan Wawasan untuk Amazon Personalisasi untuk mempelajari data Anda melalui wawasan data serta statistik kolom dan baris. Laporan ini dapat memberi tahu Anda jika Anda memiliki masalah jenis apa pun dalam data Anda. Dan Anda dapat mempelajari tindakan apa yang dapat Anda ambil untuk meningkatkan data Anda. Tindakan ini dapat membantu Anda memenuhi persyaratan sumber daya Amazon Personalize, seperti persyaratan pelatihan model, atau dapat mengarah pada rekomendasi yang lebih baik.

Setelah mempelajari data Anda melalui visualisasi dan wawasan, Anda dapat menggunakan informasi ini untuk membantu Anda menerapkan transformasi tambahan untuk meningkatkan data Anda. Atau, jika Anda selesai menyiapkan data, Anda dapat memprosesnya dan mengimpornya ke Amazon Personalize. Untuk informasi tentang mengubah data Anda, lihatMengubah data. Untuk informasi tentang memproses dan mengimpor data, lihatMemproses data dan mengimpornya ke Amazon Personalize.

Menghasilkan visualisasi

Anda dapat menggunakan Data Wrangler untuk membuat berbagai jenis grafik, seperti histogram dan plot pencar. Misalnya, Anda dapat membuat histogram untuk mengidentifikasi outlier dalam data Anda. Untuk menghasilkan visualisasi data, Anda menambahkan langkah Analisis ke alur Anda dan, dari tipe Analisis, pilih visualisasi yang ingin Anda buat.

Untuk informasi selengkapnya tentang membuat visualisasi di Data Wrangler, lihat Menganalisis dan Memvisualisasikan di Panduan Pengembang Amazon. SageMaker

Menghasilkan wawasan data

Anda dapat menggunakan Data Wrangler untuk menghasilkan laporan Kualitas Data dan Wawasan untuk Amazon Personalisasi khusus untuk jenis kumpulan data Anda. Sebelum membuat laporan, kami menyarankan Anda mengubah data Anda untuk memenuhi persyaratan Amazon Personalize. Ini akan menghasilkan wawasan yang lebih relevan. Untuk informasi selengkapnya, lihat Mengubah data.

Melaporkan konten

Laporan Kualitas Data dan Wawasan untuk Amazon Personalize mencakup bagian berikut:

  • Ringkasan: Ringkasan laporan mencakup statistik kumpulan data dan peringatan prioritas tinggi:

    • Statistik kumpulan data: Ini termasuk Amazon Personalisasi statistik tertentu, seperti jumlah pengguna unik dalam data interaksi Anda, dan statistik umum, seperti jumlah nilai atau outlier yang hilang.

    • Peringatan prioritas tinggi: Ini adalah Amazon Personalisasi wawasan spesifik yang memiliki dampak paling besar pada pelatihan atau rekomendasi. Setiap peringatan mencakup tindakan yang disarankan yang dapat Anda ambil untuk menyelesaikan masalah.

  • Baris duplikat dan Baris tidak lengkap: Bagian ini mencakup informasi tentang baris mana yang memiliki nilai yang hilang dan baris mana yang diduplikasi dalam data Anda.

  • Ringkasan fitur: Bagian ini mencakup tipe data untuk setiap kolom, informasi data yang tidak valid atau hilang, dan jumlah peringatan.

  • Detail fitur: Bagian ini mencakup subbagian dengan informasi terperinci untuk setiap kolom data Anda. Setiap subbagian mencakup statistik untuk kolom, seperti jumlah nilai kategoris, dan informasi nilai yang hilang. Dan setiap subbagian menyertakan Amazon Personalisasi wawasan spesifik dan tindakan yang disarankan untuk kolom data. Misalnya, wawasan mungkin menunjukkan bahwa kolom memiliki lebih dari 30 kategori yang mungkin.

Masalah tipe data

Laporan mengidentifikasi kolom yang bukan tipe data yang benar dan menentukan jenis yang diperlukan. Untuk mendapatkan wawasan yang terkait dengan fitur-fitur ini, Anda harus mengonversi tipe data kolom dan membuat laporan lagi. Untuk mengonversi tipe, Anda dapat menggunakan Data Wrangler mengubah Nilai Parse sebagai Jenis.

Amazon Personalisasi wawasan

Wawasan Personalisasi Amazon mencakup temuan dan tindakan yang disarankan. Tindakan ini opsional. Misalnya, laporan mungkin menyertakan wawasan dan tindakan yang terkait dengan jumlah kategori untuk kolom data kategoris. Jika Anda tidak percaya kolom itu kategoris, Anda dapat mengabaikan wawasan ini dan tidak mengambil tindakan.

Kecuali untuk perbedaan kata-kata kecil, Amazon Personalisasi wawasan spesifik sama dengan wawasan kumpulan data tunggal yang mungkin Anda hasilkan saat menganalisis data Anda dengan Amazon Personalize. Misalnya, laporan wawasan di Data Wrangler mencakup wawasan seperti “Kumpulan data interaksi Item hanya memiliki X pengguna unik dengan dua atau lebih interaksi.” Tapi itu tidak termasuk wawasan seperti “X% item dalam kumpulan data Item tidak memiliki interaksi dalam kumpulan data interaksi Item.”

Untuk daftar kemungkinan Amazon Personalisasi wawasan tertentu, lihat wawasan yang tidak mereferensikan beberapa kumpulan data. Wawasan data

Contoh laporan

Tampilan dan nuansa laporan Amazon Personalize sama dengan laporan wawasan umum di Data Wrangler. Untuk contoh laporan wawasan umum, lihat Mendapatkan Wawasan Tentang Data dan Kualitas Data di Panduan SageMaker Pengembang Amazon. Contoh berikut menunjukkan bagaimana bagian ringkasan laporan untuk kumpulan data interaksi Item. Ini mencakup statistik kumpulan data dan beberapa kemungkinan peringatan kumpulan data interaksi Item prioritas tinggi.

Menggambarkan bagian ringkasan laporan untuk kumpulan data interaksi Item.

Contoh berikut menunjukkan bagaimana bagian detail fitur untuk TYPE kolom EVENT _ dari kumpulan data interaksi Item mungkin muncul dalam laporan.

Menggambarkan bagian detail fitur untuk TYPE kolom EVENT _ dari kumpulan data interaksi Item.

Menghasilkan laporan

Untuk menghasilkan Laporan Kualitas Data dan Wawasan untuk Amazon Personalisasi, pilih Dapatkan wawasan data untuk transformasi dan buat analisis.

Untuk menghasilkan Laporan Kualitas Data dan Wawasan untuk Amazon Personalisasi
  1. Pilih opsi + untuk transformasi yang Anda analisis. Jika Anda belum menambahkan transformasi, pilih + untuk transformasi tipe Data. Data Wrangler menambahkan transformasi ini secara otomatis ke alur Anda.

  2. Pilih Dapatkan wawasan data. Panel Create analysis akan ditampilkan.

  3. Untuk jenis Analisis, pilih Laporan Kualitas Data dan Wawasan untuk Amazon Personalisasi.

  4. Untuk jenis Dataset, pilih jenis kumpulan data Amazon Personalize yang sedang Anda analisis.

  5. Secara opsional pilih Jalankan pada data lengkap. Secara default, Data Wrangler menghasilkan wawasan hanya pada sampel data Anda.

  6. Pilih Buat. Ketika analisis selesai, laporan muncul.