Variabel - Amazon Fraud Detector

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Variabel

Variabel mewakili elemen data yang ingin Anda gunakan dalam prediksi penipuan. Variabel-variabel ini dapat diambil dari kumpulan data peristiwa yang Anda siapkan untuk melatih model Anda, dari output skor risiko model Amazon Fraud Detector, atau dari model Amazon. SageMaker Untuk informasi lebih lanjut tentang variabel yang diambil dari dataset peristiwa, lihat. Dapatkan persyaratan dataset acara menggunakan data model explorer

Variabel yang ingin Anda gunakan dalam prediksi penipuan Anda harus terlebih dahulu dibuat dan kemudian ditambahkan ke acara saat membuat jenis acara Anda. Setiap variabel yang Anda buat harus diberi tipe data, nilai default, dan opsional tipe variabel. Amazon Fraud Detector memperkaya beberapa variabel yang Anda berikan seperti alamat IP, nomor identifikasi bank (BIN), dan nomor telepon, untuk membuat input tambahan dan meningkatkan kinerja untuk model yang menggunakan variabel ini.

Jenis Data

Variabel harus memiliki tipe data untuk elemen data yang variabel mewakili dan opsional dapat ditugaskan salah satu yang telah ditetapkan. Jenis variabel Untuk variabel yang ditugaskan untuk jenis variabel, tipe data pra-dipilih. Jenis data yang mungkin termasuk jenis berikut:

Tipe data Deskripsi Nilai default Contoh nilai
String Kombinasi huruf, bilangan bulat, atau keduanya <empty>

abc, 123

Bulat Bilangan bulat positif atau negatif 0 1, -1
Boolean Benar atau Salah Salah Betul, Salah
DateTime Tanggal dan waktu yang ditentukan dalam format UTC standar ISO 8601 saja <empty> 2019-11-30T 13:01:01 Z
Desimal Angka dengan titik desimal 0.0 4.01, 0,10

Nilai default

Variabel harus memiliki nilai default. Saat Amazon Fraud Detector menghasilkan prediksi penipuan, nilai default ini digunakan untuk menjalankan aturan atau model jika Amazon Fraud Detector tidak menerima nilai untuk variabel. Nilai default yang Anda berikan harus sesuai dengan tipe data yang dipilih. Di Konsol AWS, Amazon Fraud Detector menetapkan nilai default 0 untuk bilangan bulat, untuk Boolean, false untuk float, dan (kosong) 0.0 untuk string. Anda dapat menetapkan nilai default kustom untuk salah satu jenis data ini.

Jenis variabel

Bila Anda membuat variabel, Anda opsional dapat menetapkan variabel untuk jenis variabel. Jenis variabel mewakili elemen data umum yang digunakan untuk melatih model dan untuk menghasilkan prediksi penipuan. Hanya variabel dengan tipe variabel terkait yang dapat digunakan untuk pelatihan model. Sebagai bagian dari proses pelatihan model, Amazon Fraud Detector menggunakan jenis variabel yang terkait dengan variabel untuk melakukan pengayaan variabel, rekayasa fitur, dan penilaian risiko.

Amazon Fraud Detector telah menentukan jenis variabel berikut yang dapat digunakan untuk menetapkan ke variabel Anda.

Kategori Tipe variabel Deskripsi Tipe data Contoh
Sesi IP_ADDRESS Alamat IP yang dikumpulkan selama acara berlangsung String 192.0.2.0

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan geolokasi

AGEN PENGGUNA Agen pengguna yang dikumpulkan selama acara berlangsung String Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv:68.0) Tokek 20100101
SIDIK JARI Pengenal unik untuk perangkat yang digunakan untuk acara tersebut String sadfow987u234
SESSION_ID ID sesi untuk sesi aktif acara String sid123456789
AD_CREDENTIALS_VALID Menunjukkan apakah mandat yang digunakan untuk event login valid Boolean Benar
Pengguna EMAIL_ALAMAT Alamat email yang dikumpulkan selama acara berlangsung String abc@domain.com
NOMOR TELEPON Nomor telepon yang dikumpulkan selama acara berlangsung String +1 555-0100

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan nomor telepon

Penagihan BILLING_NAME Nama yang terkait dengan alamat penagihan String John Doe
BILLING_TELEPON Nomor telepon yang terkait dengan alamat penagihan String +1 555-0100

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan nomor telepon

BILLING_ADDRESS_L1 Baris pertama dari alamat penagihan String Setiap jalan
BILLING_ADDRESS_L2 Baris kedua dari alamat penagihan String Unit 123
BILLING_CITY Kota yang ada di alamat penagihan String Kota mana saja
BILLING_STATE Negara bagian atau provinsi yang ada di alamat penagihan String Setiap negara bagian atau provinsi
BILLING_COUNTRY Negara yang ada di alamat penagihan String Setiap negara

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan geolokasi

PENAGIHAN_ZIP Kode pos yang ada di alamat penagihan String 01234

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan geolokasi

Pengiriman SHIPPING_NAME Nama yang terkait dengan alamat pengiriman String John Doe
SHIPPING_PHONE Nomor telepon yang terkait dengan alamat pengiriman String +1 555-0100

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan nomor telepon

SHIPPING_ADDRESS_L1 Baris pertama dari alamat pengiriman String 123 Setiap Jalan
SHIPPING_ADDRESS_L2 Baris kedua dari alamat pengiriman String Satuan 123
SHIPPING_CITY Kota yang ada di alamat pengiriman String Kota mana saja
SHIPPING_STATE Negara bagian atau provinsi yang ada di alamat pengiriman String Setiap Negara
SHIPPING_COUNTRY Negara yang ada di alamat pengiriman String Setiap Negara

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan geolokasi

PENGIRIMAN_ZIP Kode pos yang ada di alamat pengiriman String 01234

Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan geolokasi

Pembayaran ORDER_ID Pengenal unik untuk transaksi String LUX60
HARGA Total harga pesanan String 560.00
CURRENCY_KODE Kode mata uang ISO 4217 String USD
PEMBAYARAN_TYPE Metode pembayaran yang digunakan untuk pembayaran selama acara berlangsung String Kartu kredit
KODE Kode alfanumerik yang dikirim oleh penerbit kartu kredit atau bank penerbit String 0000
AVS Kode respons sistem verifikasi alamat (AVS) dari prosesor kartu String Y
Produk PRODUCT_CATEGORY Kategori produk item pesanan String Dapur
Khusus NUMERIK Setiap variabel yang dapat direpresentasikan sebagai bilangan real Desimal 1.224
KATEGORIS Variabel apa pun yang menjelaskan kategori, segmen, atau grup String Besar
FREE_FORM_TEXT Teks formulir gratis apa pun yang diambil sebagai bagian dari acara (misalnya, ulasan atau komentar pelanggan) String Contoh input teks formulir bebas

Menetapkan variabel untuk jenis variabel

Jika Anda berencana menggunakan variabel untuk melatih model Anda, penting bagi Anda untuk memilih jenis variabel yang tepat untuk ditetapkan ke variabel. Penetapan jenis variabel yang salah dapat berdampak negatif pada kinerja model Anda. Hal ini juga bisa menjadi sangat sulit bagi Anda mengubah tugas nanti, terutama jika beberapa model dan peristiwa telah menggunakan variabel.

Anda dapat menetapkan variabel Anda salah satu dari jenis variabel yang telah ditentukan sebelumnya atau salah satu jenis variabel kustom -FREE_FORM_TEXT,CATEGORICAL, atauNUMERIC.

Catatan penting untuk menetapkan variabel ke jenis variabel yang tepat

  1. Jika variabel cocok dengan salah satu jenis variabel yang telah ditetapkan, menggunakannya. Pastikan jenis variabel sesuai dengan variabel. Misalnya, jika Anda menetapkan variabel ip_address ke tipe variabel, EMAIL_ADDRESS variabel ip_address tidak akan diperkaya dengan pengayaan seperti ASN, ISP, geo-location, dan skor risiko. Untuk informasi selengkapnya, lihat Pengayaan variabel.

  2. Jika variabel tidak cocok dengan salah satu jenis variabel yang telah ditetapkan, ikuti rekomendasi yang tercantum di bawah ini untuk menetapkan salah satu jenis variabel kustom.

  3. Menetapkan jenis CATEGORICAL variabel untuk variabel yang biasanya tidak memiliki urutan alami dan dapat dimasukkan ke dalam kategori, segmen, atau kelompok. Dataset yang Anda gunakan untuk melatih model Anda mungkin memiliki variabel ID seperti, merchant_id, campaign_id, atau policy_id. Variabel-variabel ini mewakili kelompok (misalnya, semua pelanggan dengan policy_id yang sama mewakili grup). Variabel yang memiliki data berikut harus ditetapkan CATEGORICAL jenis variabel -

    • Variabel yang berisi data seperti Customer_ID, Segment_ID, Color_ID, department_code, atau Product_ID.

    • Variabel yang berisi data Boolean dengan nilai true, false, atau null.

    • Variabel yang dapat dimasukkan ke dalam kelompok atau kategori seperti nama perusahaan, kategori produk, jenis kartu, atau media rujukan.

    catatan

    ENTITY_IDadalah tipe variabel cadangan yang digunakan oleh Amazon Fraud Detector untuk menetapkan ke variabel ENTITY_ID. Variabel ENTITY_ID adalah ID entitas yang memulai tindakan yang ingin Anda evaluasi. Jika Anda membuat tipe model Transaction Fraud Insight (TFI), Anda harus menyediakan variabel ENTITY_ID. Anda harus memutuskan variabel mana dalam data Anda secara unik mengidentifikasi entitas yang memulai tindakan dan meneruskannya sebagai variabel ENTITY_ID. Tetapkan tipe variabel KATEGORIS ke semua ID lain dalam kumpulan data Anda, jika ada dan jika Anda menggunakannya untuk pelatihan model. Contoh ID lain yang bukan entitas dalam kumpulan data Anda dapat berupa Merchant_ID, Policy_ID, dan Campaign_ID.

  4. Menetapkan jenis FREE_FORM_TEXT variabel untuk variabel yang berisi blok teks. Contoh jenis variabel FREE_FORM_TEXT adalah - ulasan pengguna, komentar, tanggal, dan kode rujukan. Data FREE_FORM_TEXT berisi beberapa token yang dipisahkan oleh pembatas. Pembatas dapat berupa karakter selain simbol alfa-numerik dan garis bawah. Misalnya, ulasan dan komentar pengguna dapat dipisahkan oleh pembatas “spasi”, tanggal dan kode rujukan dapat menggunakan tanda hubung sebagai pembatas untuk memisahkan awalan, akhiran, dan bagian perantara. Amazon Fraud Detector menggunakan pembatas untuk mengekstrak data dari variabel FREE_FORM_TEXT.

  5. Menetapkan NUMERIC jenis variabel untuk variabel yang bilangan real dan memiliki urutan yang melekat. Contoh variabel NUMERIC termasuk day_of_the_week, incident_severity, customer_rating. Meskipun, Anda dapat menetapkan jenis variabel KATEGORIS untuk variabel-variabel ini, kami sangat menyarankan untuk menetapkan semua variabel bilangan real dengan urutan yang melekat pada tipe variabel NUMERIC.

Pengayaan variabel

Amazon Fraud Detector memperkaya beberapa elemen data mentah yang Anda berikan seperti alamat IP, nomor identifikasi bank (BIN), dan nomor telepon, untuk membuat input tambahan dan meningkatkan kinerja untuk model yang menggunakan elemen data ini. Pengayaan membantu mengidentifikasi situasi yang berpotensi mencurigakan dan membantu model untuk menangkap lebih banyak penipuan.

Pengayaan nomor telepon

Amazon Fraud Detector memperkaya data nomor telepon dengan informasi tambahan yang berkaitan dengan geolokasi, operator asli, dan validitas nomor telepon. Pengayaan nomor telepon diaktifkan secara otomatis untuk semua model yang dilatih pada atau setelah 13 Desember 2021 dan memiliki nomor telepon yang menyertakan kode negara (+xxx). Jika Anda telah memasukkan variabel nomor telepon dalam model Anda dan telah melatihnya sebelum 13 Desember 2021, latih ulang model Anda sehingga dapat memanfaatkan pengayaan ini.

Kami sangat menyarankan Anda menggunakan format berikut untuk variabel nomor telepon untuk memastikan bahwa data Anda berhasil diperkaya.

Variabel Format Deskripsi
NOMOR TELEPON Standar E.164 Pastikan untuk menyertakan kode negara (+xxx) dengan nomor telepon.
BILLING_PHONE dan SHIPPING_PHONE Standar E.164 Pastikan untuk menyertakan kode negara (+xxx) dengan nomor telepon.

Pengayaan geolokasi

Mulai 8 Februari 2022 Amazon Fraud Detector menghitung jarak fisik antara nilai IP_ADDRESS, BILLING_ZIP, dan SHIPPING_ZIP yang Anda berikan untuk suatu peristiwa. Jarak yang dihitung digunakan sebagai input untuk model deteksi penipuan Anda.

Untuk mengaktifkan pengayaan geolokasi, data peristiwa Anda harus menyertakan setidaknya dua dari tiga variabel: IP_ADDRESS, BILLING_ZIP, atau SHIPPING_ZIP. Selain itu, setiap nilai BILLING_ZIP dan SHIPPING_ZIP harus memiliki kode BILLING_COUNTRY yang valid dan kode SHIPPING_COUNTRY masing-masing. Jika Anda memiliki model yang dilatih sebelum 8 Februari 2022 dan itu termasuk variabel-variabel ini, Anda harus melatih ulang model untuk mengaktifkan pengayaan geolokasi.

Jika Amazon Fraud Detector tidak dapat menentukan lokasi yang terkait dengan nilai IP_ADDRESS, BILLING_ZIP, atau SHIPPING_ZIP untuk suatu peristiwa karena data tidak valid, nilai placeholder khusus akan digunakan sebagai gantinya. Misalnya, suatu peristiwa memiliki nilai IP_ADDRESS dan BILLING_ZIP yang valid, tetapi nilai SHIPPING_ZIP tidak valid. Dalam hal ini, pengayaan dilakukan hanya untuk IP_ADDRESS-> BILLING_ZIP. Pengayaan tidak dilakukan untuk IP_ADDRESS-> SHIPPING_ZIP dan BILLING_ZIP-> SHIPPING_ZIP. Sebaliknya, nilai placeholder digunakan di tempat mereka. Tidak masalah apakah pengayaan geolokasi diaktifkan untuk model Anda atau tidak, kinerja model Anda tidak berubah.

Anda dapat memilih keluar dari pengayaan geolokasi dengan memetakan variabel BILLING_ZIP dan SHIPPING_ZIP Anda ke tipe variabel CUSTOM_CATEGORICAL. Mengubah jenis variabel tidak memengaruhi kinerja model Anda.

Format variabel geolokasi

Kami sangat menyarankan agar Anda menggunakan format berikut untuk variabel geolokasi untuk memastikan bahwa data lokasi Anda berhasil diperkaya.

Variabel Format Deskripsi
IP_ADDRESS Alamat IPv4 Misalnya - 1.1.1.1
BILLING_ZIP dan SHIPPING_ZIP Kode pos ISO 3166-1 alpha-2 untuk negara tertentu Untuk informasi selengkapnya, lihat bagian Kode negara dan wilayah dalam topik ini.
BILLING_COUNTRY dan SHIPPING_COUNTRY Kode negara standar ISO 3166-1 alfa-2 dua huruf Untuk informasi selengkapnya, lihat bagian Kode negara dan wilayah dalam topik ini. Amazon Fraud Detector mencoba mencocokkan semua variasi umum nama suatu negara dengan kode negara standar dua huruf ISO 3166-1. Namun, kami tidak dapat menjamin mereka akan dicocokkan dengan benar.

Tabel berikut menyediakan daftar lengkap negara dan wilayah yang didukung oleh Amazon Fraud Detector untuk pengayaan geolokasi. Setiap negara dan wilayah memiliki kode negara yang ditetapkan (khususnya, kode negara dua huruf ISO 3166-1 alfa-2) dan kode pos.

Format kode pos

  • 9 - nomor

  • a - surat

  • [X] - X adalah opsional. Misalnya, Guersney “GY9 [9] 9aa” berarti “GY9 9aa” dan “GY99 9aa” valid. Gunakan satu format.

  • [X/XX] - X atau XX dapat digunakan. Misalnya, Bermuda “aa [aa/99]” berarti “aa aa” dan “aa 99" valid. Gunakan salah satu dari format ini, tetapi jangan gunakan keduanya.

  • Beberapa negara memiliki awalan tetap. Misalnya, kode pos untuk Andorra adalah AD999. Ini berarti kode negara harus dimulai dengan huruf AD diikuti oleh tiga angka.

Code Nama Kode pos
AD Andorra AD999
AR Antillen Belanda 9999
DI Austria 9999
AU Australia 9999
AZ Azerbaijan 9999
BD Bangladesh 9999
ADA Belgium 9999
BG Bulgaria 9999
BM Bermuda aa [aa/99]
OLEH Belarus 999999
CA Canada a9a
CH Swiss 9999
CL Chili 9999999
CO Kolombia 999999
CR Kosta Rika 99999
CY Cyprus 9999
CZ Ceko 999 99
DE Germany 99999
DK Denmark 9999
BERBUAT Republik Dominika 99999
DZ Aljazair 99999
EE Estonia 99999
ES Spain 99999
FI Finland 99999
FM Negara Federasi Mikronesia 99999
FO Kepulauan Faroe 999
FR France 99999
GB Britania Raya sebuah [Sebuah] 9 [Sebuah/9] 9aa
GG Guernsey GY9 [9] 9aa
GL Greenland 9999
GP Guadeloupe 99999
GT Guatemala 99999
GU Guam 99999
HR Croatia 99999
HU Hungary 9999
YAKNI Ireland a99 [A/9] [A/9] [A/9] [A/9]
IM Pulau Manusia IM9 [9] 9aa
DI DALAM India 999999
ADALAH Islandia 999
IA Italy 99999
JE Jersey JE9 [9] 9aa
JP Jepang 999-9999
KR Republik Korea 99999
LI Liechtenstein 9999
LK Sri Lanka 99999
LT Lithuania 99999
LU Luxembourg L-9999
LV Latvia LV-9999
MC Monako 99999
MD Republik Moldova 9999
MH Kepulauan Marshall 99999
MK Makedonia Utara 9999
MP Kepulauan Mariana Utara 99999
MQ Matinique 99999
MT Malta aaa 9999
MX Meksiko 99999
SAYA Malaysia 99999
NL Netherlands 9999 aa
TIDAK Norwegia 9999
NZ Selandia Baru 9999
PH Filipina 9999
PK Pakistan 99999
PL Poland 99-999
PR Puerto Riko 99999
PT Portugal 9999-999
PW Palau 99999
KEMBALI

Reuni

99999
RO Romania 999999
RU Federasi Rusia 999999
SE Sweden 999 99
SG Singapura 999999
SI Slovenia 9999
SK Slovakia 999 99
SM San Marino 99999
TH Thailand 99999
TR Turki 99999
UA Ukraina 99999
US Amerika Serikat 99999
UY Uruguay 99999
VI Kepulauan Virgin, AS 99999
WF Wallis dan Futuna 99999
YT Mayotte 99999
ZA Afrika Selatan 9999

Pengayaan Useragent

Jika Anda membuat model Account Takeover Insights (ATI), Anda harus menyediakan variabel jenis useragent variabel dalam set data Anda. Variabel ini berisi data browser, perangkat, dan OS dari peristiwa login. Amazon Fraud Detector memperkaya data agen pengguna dengan informasi tambahan seperti, dan. user_agent_family OS_family device_family