Langkah 1: Mempersiapkan Data Anda - Amazon Machine Learning

Kami tidak lagi memperbarui layanan Amazon Machine Learning atau menerima pengguna baru untuk itu. Dokumentasi ini tersedia untuk pengguna yang sudah ada, tetapi kami tidak lagi memperbaruinya. Untuk informasi selengkapnya, lihatApa itu Amazon Machine Learning.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Langkah 1: Mempersiapkan Data Anda

Dalam pembelajaran mesin, Anda biasanya mendapatkan data dan memastikan bahwa itu diformat dengan baik sebelum memulai proses pelatihan. Untuk tujuan tutorial ini, kami memperoleh dataset sampel dariRepositori Machine Learning, diformat agar sesuai dengan pedoman Amazon IL, dan membuatnya tersedia untuk Anda unduh. Unduh dataset dari lokasi penyimpanan Amazon Simple Storage Service (Amazon S3) kami dan unggah ke bucket S3 Anda sendiri dengan mengikuti prosedur dalam topik ini.

Untuk persyaratan pemformatan Amazon IL, lihatMemahami Format Data untuk Amazon.

Untuk mengunduh dataset
  1. Download file yang berisi data historis bagi nasabah yang telah membeli produk serupa dengan deposit jangka bank Anda dengan mengklikbanking.zip. Unzip folder dan simpan file banking.csv ke komputer Anda.

  2. Unduh file yang akan Anda gunakan untuk memprediksi apakah calon pelanggan akan menanggapi penawaran Anda dengan mengklikbanking-batch.zip. Unzip folder dan simpan file banking-batch.csv ke komputer Anda.

  3. Buka banking.csv. Anda akan melihat baris dan kolom data. Parameterbaris sundulanberisi nama atribut untuk setiap kolom. Sesitambahanadalah unik, bernama properti yang menggambarkan karakteristik tertentu dari setiap pelanggan; misalnya, nr_employed menunjukkan status kerja pelanggan. Setiap baris mewakili koleksi pengamatan tentang satu pelanggan.

    Anda ingin model ML-mu menjawab pertanyaan “Akankah pelanggan ini berlangganan produk baru saya?”. Dibanking.csvdataset, jawaban atas pertanyaan ini adalah atributy, yang berisi nilai 1 (untuk ya) atau 0 (untuk tidak). Atribut yang Anda inginkan Amazon ML-belajar bagaimana memprediksi dikenal sebagaiatribut target.

    catatan

    Atributyadalah atribut biner. Ini hanya dapat berisi satu dari dua nilai, dalam hal ini 0 atau 1. Dalam dataset UCI asli,yatribut adalah baik Ya atau Tidak. Kami telah mengedit dataset asli untuk Anda. Semua nilai atributyitu berarti ya sekarang 1, dan semua nilai yang berarti tidak ada sekarang 0. Jika Anda menggunakan data Anda sendiri, Anda dapat menggunakan nilai lain untuk atribut biner. Untuk informasi selengkapnya tentang nilai yang valid, lihatMenggunakan Field AttributeType.

Contoh berikut menunjukkan data sebelum dan sesudah kita mengubah nilai-nilai dalam atributyke atribut biner 0 dan 1.

Parameterbanking-batch.csvberkas tidak berisiyatribut. Setelah Anda membuat model ML-nya, Anda akan menggunakan model untuk memprediksiyuntuk setiap catatan dalam file itu.

Selanjutnya, unggahbanking.csv danbanking-batch.csvfile ke Amazon S3.

Mengunggah file ke lokasi Amazon S3
  1. Masuk ke AWS Management Console dan buka konsol Amazon S3 di https://console.aws.amazon.com/s3/.

  2. DiSemua Bucketdaftar, membuat bucket atau memilih lokasi di mana Anda ingin mengunggah file.

  3. Di bilah navigasi, pilihUnggah.

  4. PilihTambahkan File.

  5. Di kotak dialog, arahkan ke desktop, pilihbanking.csvdanbanking-batch.csv, dan kemudian pilihBuka.

Sekarang, Anda siap untukbuat sumber data pelatihan.