Memilih sumber data Mempersiapkan data Memilih data Variabel peristiwa Memvalidasi data

Wawasan penipuan online

Online Fraud Insights adalah model pembelajaran mesin yang diawasi, yang berarti menggunakan contoh historis transaksi penipuan dan sah untuk melatih model tersebut. Model Online Fraud Insights dapat mendeteksi penipuan berdasarkan sedikit data historis. Masukan model fleksibel, sehingga Anda dapat menyesuaikannya untuk mendeteksi berbagai risiko penipuan termasuk ulasan palsu, penyalahgunaan promosi, dan penipuan checkout tamu.

Model Online Fraud Insights menggunakan ansambel algoritma pembelajaran mesin untuk pengayaan data, transformasi, dan klasifikasi penipuan. Sebagai bagian dari proses pelatihan model, Online Fraud Insights memperkaya elemen data mentah seperti alamat IP dan nomor BIN dengan data pihak ketiga seperti geolokasi alamat IP atau bank penerbit untuk kartu kredit. Selain data pihak ketiga, Online Fraud Insights menggunakan algoritma pembelajaran mendalam yang memperhitungkan pola penipuan yang telah terlihat di Amazon dan. AWS Pola penipuan ini menjadi fitur masukan untuk model Anda menggunakan algoritme peningkatan pohon gradien.

Untuk meningkatkan kinerja, Online Fraud Insights mengoptimalkan parameter hiper dari algoritma peningkatan pohon gradien melalui proses optimasi Bayesian. Ini secara berurutan melatih lusinan model yang berbeda dengan parameter model yang bervariasi (seperti jumlah pohon, kedalaman pohon, dan jumlah sampel per daun). Ini juga menggunakan strategi optimasi yang berbeda seperti meningkatkan populasi penipuan minoritas untuk menjaga tingkat penipuan yang sangat rendah.

Memilih sumber data

Saat melatih model Wawasan Penipuan Online, Anda dapat memilih untuk melatih model pada data peristiwa yang disimpan secara eksternal (di luar Amazon Fraud Detector) atau disimpan dalam Amazon Fraud Detector. Penyimpanan eksternal yang saat ini didukung Amazon Fraud Detector adalah Amazon Simple Storage Service (Amazon S3). Jika Anda menggunakan penyimpanan eksternal, kumpulan data acara harus diunggah sebagai format nilai yang dipisahkan koma (CSV) ke bucket Amazon S3. Opsi penyimpanan data ini disebut dalam konfigurasi pelatihan model sebagai EXTERNAL_EVENTS (untuk penyimpanan eksternal) dan INGESTED_EVENTS (untuk penyimpanan internal). Untuk informasi selengkapnya tentang sumber data yang tersedia dan cara menyimpan data di dalamnya, lihatPenyimpanan data acara.

Mempersiapkan data

Di mana pun Anda memilih untuk menyimpan data acara Anda (Amazon S3 atau Amazon Fraud Detector), persyaratan untuk jenis model Wawasan Penipuan Online adalah sama.

Dataset Anda harus berisi header kolom EVENT_LABEL. Variabel ini mengklasifikasikan suatu peristiwa sebagai penipuan atau sah. Saat menggunakan file CSV (penyimpanan eksternal), Anda harus menyertakan EVENT_LABEL untuk setiap peristiwa dalam file. Untuk penyimpanan internal, bidang EVENT_LABEL bersifat opsional tetapi semua peristiwa harus diberi label untuk disertakan dalam kumpulan data pelatihan. Saat mengonfigurasi pelatihan model, Anda dapat memilih apakah akan mengabaikan peristiwa yang tidak berlabel, mengambil label yang sah untuk peristiwa yang tidak berlabel, atau mengasumsikan label penipuan untuk semua peristiwa yang tidak berlabel.

Memilih data

Lihat Mengumpulkan data acara untuk informasi tentang memilih data untuk melatih model Wawasan Penipuan Online Anda.

Pelatihan Online Fraud Insights memproses sampel dan mempartisi data historis berdasarkan EVENT_TIMESTAMP. Tidak perlu mengambil sampel data secara manual dan melakukannya dapat berdampak negatif pada hasil model Anda.

Variabel peristiwa

Model Wawasan Penipuan Online membutuhkan setidaknya dua variabel, terlepas dari metadata peristiwa yang diperlukan, yang telah lulus validasi data untuk pelatihan model dan memungkinkan hingga 100 variabel per model. Umumnya, semakin banyak variabel yang Anda berikan, semakin baik model dapat membedakan antara penipuan dan peristiwa yang sah. Meskipun model Wawasan Penipuan Online dapat mendukung lusinan variabel, termasuk variabel khusus, kami merekomendasikan menyertakan alamat IP dan alamat email karena variabel ini biasanya paling efektif dalam mengidentifikasi entitas yang sedang dievaluasi.

Memvalidasi data

Sebagai bagian dari proses pelatihan, Wawasan Penipuan Online akan memvalidasi kumpulan data untuk masalah kualitas data yang dapat memengaruhi pelatihan model. Setelah memvalidasi data, Amazon Fraud Detector akan mengambil tindakan yang tepat untuk membangun model terbaik. Ini termasuk mengeluarkan peringatan untuk masalah kualitas data potensial, secara otomatis menghapus variabel yang memiliki masalah kualitas data, atau mengeluarkan kesalahan dan menghentikan proses pelatihan model. Untuk informasi selengkapnya, lihat validasi kumpulan data.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Pilih jenis model

Wawasan penipuan transaksi