Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Variabel
Variabel mewakili elemen data yang ingin Anda gunakan dalam prediksi penipuan. Variabel-variabel ini dapat diambil dari kumpulan data peristiwa yang Anda siapkan untuk melatih model Anda, dari output skor risiko model Amazon Fraud Detector, atau dari model Amazon. SageMaker Untuk informasi lebih lanjut tentang variabel yang diambil dari dataset peristiwa, lihat. Dapatkan persyaratan dataset acara menggunakan data model explorer
Variabel yang ingin Anda gunakan dalam prediksi penipuan Anda harus terlebih dahulu dibuat dan kemudian ditambahkan ke acara saat membuat jenis acara Anda. Setiap variabel yang Anda buat harus diberi tipe data, nilai default, dan opsional tipe variabel. Amazon Fraud Detector memperkaya beberapa variabel yang Anda berikan seperti alamat IP, nomor identifikasi bank (BIN), dan nomor telepon, untuk membuat input tambahan dan meningkatkan kinerja untuk model yang menggunakan variabel ini.
Jenis Data
Variabel harus memiliki tipe data untuk elemen data yang variabel mewakili dan opsional dapat ditugaskan salah satu yang telah ditetapkan. Jenis variabel Untuk variabel yang ditugaskan untuk jenis variabel, tipe data pra-dipilih. Jenis data yang mungkin termasuk jenis berikut:
Tipe data | Deskripsi | Nilai default | Contoh nilai |
---|---|---|---|
String | Kombinasi huruf, bilangan bulat, atau keduanya | <empty> |
abc, 123 |
Bulat | Bilangan bulat positif atau negatif | 0 | 1, -1 |
Boolean | Benar atau Salah | Salah | Betul, Salah |
DateTime | Tanggal dan waktu yang ditentukan dalam format UTC standar ISO 8601 saja | <empty> | 2019-11-30T 13:01:01 Z |
Desimal | Angka dengan titik desimal | 0.0 | 4.01, 0,10 |
Nilai default
Variabel harus memiliki nilai default. Saat Amazon Fraud Detector menghasilkan prediksi penipuan, nilai default ini digunakan untuk menjalankan aturan atau model jika Amazon Fraud Detector tidak menerima nilai untuk variabel. Nilai default yang Anda berikan harus sesuai dengan tipe data yang dipilih. Di Konsol AWS, Amazon Fraud Detector menetapkan nilai default 0
untuk bilangan bulat, untuk Boolean, false
untuk float, dan (kosong) 0.0
untuk string. Anda dapat menetapkan nilai default kustom untuk salah satu jenis data ini.
Jenis variabel
Bila Anda membuat variabel, Anda opsional dapat menetapkan variabel untuk jenis variabel. Jenis variabel mewakili elemen data umum yang digunakan untuk melatih model dan untuk menghasilkan prediksi penipuan. Hanya variabel dengan tipe variabel terkait yang dapat digunakan untuk pelatihan model. Sebagai bagian dari proses pelatihan model, Amazon Fraud Detector menggunakan jenis variabel yang terkait dengan variabel untuk melakukan pengayaan variabel, rekayasa fitur, dan penilaian risiko.
Amazon Fraud Detector telah menentukan jenis variabel berikut yang dapat digunakan untuk menetapkan ke variabel Anda.
Kategori | Tipe variabel | Deskripsi | Tipe data | Contoh |
---|---|---|---|---|
Sesi | IP_ADDRESS | Alamat IP yang dikumpulkan selama acara berlangsung | String | 192.0.2.0 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan geolokasi |
AGEN PENGGUNA | Agen pengguna yang dikumpulkan selama acara berlangsung | String | Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv:68.0) Tokek 20100101 | |
SIDIK JARI | Pengenal unik untuk perangkat yang digunakan untuk acara tersebut | String | sadfow987u234 | |
SESSION_ID | ID sesi untuk sesi aktif acara | String | sid123456789 | |
AD_CREDENTIALS_VALID | Menunjukkan apakah mandat yang digunakan untuk event login valid | Boolean | Benar | |
Pengguna | EMAIL_ALAMAT | Alamat email yang dikumpulkan selama acara berlangsung | String | abc@domain.com |
NOMOR TELEPON | Nomor telepon yang dikumpulkan selama acara berlangsung | String | +1 555-0100 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan nomor telepon |
|
Penagihan | BILLING_NAME | Nama yang terkait dengan alamat penagihan | String | John Doe |
BILLING_TELEPON | Nomor telepon yang terkait dengan alamat penagihan | String | +1 555-0100 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan nomor telepon |
|
BILLING_ADDRESS_L1 | Baris pertama dari alamat penagihan | String | Setiap jalan | |
BILLING_ADDRESS_L2 | Baris kedua dari alamat penagihan | String | Unit 123 | |
BILLING_CITY | Kota yang ada di alamat penagihan | String | Kota mana saja | |
BILLING_STATE | Negara bagian atau provinsi yang ada di alamat penagihan | String | Setiap negara bagian atau provinsi | |
BILLING_COUNTRY | Negara yang ada di alamat penagihan | String | Setiap negara Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan geolokasi |
|
PENAGIHAN_ZIP | Kode pos yang ada di alamat penagihan | String | 01234 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan geolokasi |
|
Pengiriman | SHIPPING_NAME | Nama yang terkait dengan alamat pengiriman | String | John Doe |
SHIPPING_PHONE | Nomor telepon yang terkait dengan alamat pengiriman | String | +1 555-0100 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan nomor telepon |
|
SHIPPING_ADDRESS_L1 | Baris pertama dari alamat pengiriman | String | 123 Setiap Jalan | |
SHIPPING_ADDRESS_L2 | Baris kedua dari alamat pengiriman | String | Satuan 123 | |
SHIPPING_CITY | Kota yang ada di alamat pengiriman | String | Kota mana saja | |
SHIPPING_STATE | Negara bagian atau provinsi yang ada di alamat pengiriman | String | Setiap Negara | |
SHIPPING_COUNTRY | Negara yang ada di alamat pengiriman | String | Setiap Negara Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan geolokasi |
|
PENGIRIMAN_ZIP | Kode pos yang ada di alamat pengiriman | String | 01234 Catatan: Amazon Fraud Detector memperkaya data ini. Untuk informasi selengkapnya, lihat Pengayaan geolokasi |
|
Pembayaran | ORDER_ID | Pengenal unik untuk transaksi | String | LUX60 |
HARGA | Total harga pesanan | String | 560.00 | |
CURRENCY_KODE | Kode mata uang ISO 4217 | String | USD | |
PEMBAYARAN_TYPE | Metode pembayaran yang digunakan untuk pembayaran selama acara berlangsung | String | Kartu kredit | |
KODE | Kode alfanumerik yang dikirim oleh penerbit kartu kredit atau bank penerbit | String | 0000 | |
AVS | Kode respons sistem verifikasi alamat (AVS) dari prosesor kartu | String | Y | |
Produk | PRODUCT_CATEGORY | Kategori produk item pesanan | String | Dapur |
Khusus | NUMERIK | Setiap variabel yang dapat direpresentasikan sebagai bilangan real | Desimal | 1.224 |
KATEGORIS | Variabel apa pun yang menjelaskan kategori, segmen, atau grup | String | Besar | |
FREE_FORM_TEXT | Teks formulir gratis apa pun yang diambil sebagai bagian dari acara (misalnya, ulasan atau komentar pelanggan) | String | Contoh input teks formulir bebas |
Menetapkan variabel untuk jenis variabel
Jika Anda berencana menggunakan variabel untuk melatih model Anda, penting bagi Anda untuk memilih jenis variabel yang tepat untuk ditetapkan ke variabel. Penetapan jenis variabel yang salah dapat berdampak negatif pada kinerja model Anda. Hal ini juga bisa menjadi sangat sulit bagi Anda mengubah tugas nanti, terutama jika beberapa model dan peristiwa telah menggunakan variabel.
Anda dapat menetapkan variabel Anda salah satu dari jenis variabel yang telah ditentukan sebelumnya atau salah satu jenis variabel kustom -FREE_FORM_TEXT
,CATEGORICAL
, atauNUMERIC
.
Catatan penting untuk menetapkan variabel ke jenis variabel yang tepat
-
Jika variabel cocok dengan salah satu jenis variabel yang telah ditetapkan, menggunakannya. Pastikan jenis variabel sesuai dengan variabel. Misalnya, jika Anda menetapkan variabel ip_address ke tipe variabel,
EMAIL_ADDRESS
variabel ip_address tidak akan diperkaya dengan pengayaan seperti ASN, ISP, geo-location, dan skor risiko. Untuk informasi selengkapnya, lihat Pengayaan variabel. -
Jika variabel tidak cocok dengan salah satu jenis variabel yang telah ditetapkan, ikuti rekomendasi yang tercantum di bawah ini untuk menetapkan salah satu jenis variabel kustom.
-
Menetapkan jenis
CATEGORICAL
variabel untuk variabel yang biasanya tidak memiliki urutan alami dan dapat dimasukkan ke dalam kategori, segmen, atau kelompok. Dataset yang Anda gunakan untuk melatih model Anda mungkin memiliki variabel ID seperti, merchant_id, campaign_id, atau policy_id. Variabel-variabel ini mewakili kelompok (misalnya, semua pelanggan dengan policy_id yang sama mewakili grup). Variabel yang memiliki data berikut harus ditetapkan CATEGORICAL jenis variabel --
Variabel yang berisi data seperti Customer_ID, Segment_ID, Color_ID, department_code, atau Product_ID.
-
Variabel yang berisi data Boolean dengan nilai true, false, atau null.
-
Variabel yang dapat dimasukkan ke dalam kelompok atau kategori seperti nama perusahaan, kategori produk, jenis kartu, atau media rujukan.
catatan
ENTITY_ID
adalah tipe variabel cadangan yang digunakan oleh Amazon Fraud Detector untuk menetapkan ke variabel ENTITY_ID. Variabel ENTITY_ID adalah ID entitas yang memulai tindakan yang ingin Anda evaluasi. Jika Anda membuat tipe model Transaction Fraud Insight (TFI), Anda harus menyediakan variabel ENTITY_ID. Anda harus memutuskan variabel mana dalam data Anda secara unik mengidentifikasi entitas yang memulai tindakan dan meneruskannya sebagai variabel ENTITY_ID. Tetapkan tipe variabel KATEGORIS ke semua ID lain dalam kumpulan data Anda, jika ada dan jika Anda menggunakannya untuk pelatihan model. Contoh ID lain yang bukan entitas dalam kumpulan data Anda dapat berupa Merchant_ID, Policy_ID, dan Campaign_ID. -
-
Menetapkan jenis
FREE_FORM_TEXT
variabel untuk variabel yang berisi blok teks. Contoh jenis variabel FREE_FORM_TEXT adalah - ulasan pengguna, komentar, tanggal, dan kode rujukan. Data FREE_FORM_TEXT berisi beberapa token yang dipisahkan oleh pembatas. Pembatas dapat berupa karakter selain simbol alfa-numerik dan garis bawah. Misalnya, ulasan dan komentar pengguna dapat dipisahkan oleh pembatas “spasi”, tanggal dan kode rujukan dapat menggunakan tanda hubung sebagai pembatas untuk memisahkan awalan, akhiran, dan bagian perantara. Amazon Fraud Detector menggunakan pembatas untuk mengekstrak data dari variabel FREE_FORM_TEXT. -
Menetapkan NUMERIC jenis variabel untuk variabel yang bilangan real dan memiliki urutan yang melekat. Contoh variabel NUMERIC termasuk day_of_the_week, incident_severity, customer_rating. Meskipun, Anda dapat menetapkan jenis variabel KATEGORIS untuk variabel-variabel ini, kami sangat menyarankan untuk menetapkan semua variabel bilangan real dengan urutan yang melekat pada tipe variabel NUMERIC.
Pengayaan variabel
Amazon Fraud Detector memperkaya beberapa elemen data mentah yang Anda berikan seperti alamat IP, nomor identifikasi bank (BIN), dan nomor telepon, untuk membuat input tambahan dan meningkatkan kinerja untuk model yang menggunakan elemen data ini. Pengayaan membantu mengidentifikasi situasi yang berpotensi mencurigakan dan membantu model untuk menangkap lebih banyak penipuan.
Pengayaan nomor telepon
Amazon Fraud Detector memperkaya data nomor telepon dengan informasi tambahan yang berkaitan dengan geolokasi, operator asli, dan validitas nomor telepon. Pengayaan nomor telepon diaktifkan secara otomatis untuk semua model yang dilatih pada atau setelah 13 Desember 2021 dan memiliki nomor telepon yang menyertakan kode negara (+xxx). Jika Anda telah memasukkan variabel nomor telepon dalam model Anda dan telah melatihnya sebelum 13 Desember 2021, latih ulang model Anda sehingga dapat memanfaatkan pengayaan ini.
Kami sangat menyarankan Anda menggunakan format berikut untuk variabel nomor telepon untuk memastikan bahwa data Anda berhasil diperkaya.
Pengayaan geolokasi
Mulai 8 Februari 2022 Amazon Fraud Detector menghitung jarak fisik antara nilai IP_ADDRESS, BILLING_ZIP, dan SHIPPING_ZIP yang Anda berikan untuk suatu peristiwa. Jarak yang dihitung digunakan sebagai input untuk model deteksi penipuan Anda.
Untuk mengaktifkan pengayaan geolokasi, data peristiwa Anda harus menyertakan setidaknya dua dari tiga variabel: IP_ADDRESS, BILLING_ZIP, atau SHIPPING_ZIP. Selain itu, setiap nilai BILLING_ZIP dan SHIPPING_ZIP harus memiliki kode BILLING_COUNTRY yang valid dan kode SHIPPING_COUNTRY masing-masing. Jika Anda memiliki model yang dilatih sebelum 8 Februari 2022 dan itu termasuk variabel-variabel ini, Anda harus melatih ulang model untuk mengaktifkan pengayaan geolokasi.
Jika Amazon Fraud Detector tidak dapat menentukan lokasi yang terkait dengan nilai IP_ADDRESS, BILLING_ZIP, atau SHIPPING_ZIP untuk suatu peristiwa karena data tidak valid, nilai placeholder khusus akan digunakan sebagai gantinya. Misalnya, suatu peristiwa memiliki nilai IP_ADDRESS dan BILLING_ZIP yang valid, tetapi nilai SHIPPING_ZIP tidak valid. Dalam hal ini, pengayaan dilakukan hanya untuk IP_ADDRESS-> BILLING_ZIP. Pengayaan tidak dilakukan untuk IP_ADDRESS-> SHIPPING_ZIP dan BILLING_ZIP-> SHIPPING_ZIP. Sebaliknya, nilai placeholder digunakan di tempat mereka. Tidak masalah apakah pengayaan geolokasi diaktifkan untuk model Anda atau tidak, kinerja model Anda tidak berubah.
Anda dapat memilih keluar dari pengayaan geolokasi dengan memetakan variabel BILLING_ZIP dan SHIPPING_ZIP Anda ke tipe variabel CUSTOM_CATEGORICAL. Mengubah jenis variabel tidak memengaruhi kinerja model Anda.
Format variabel geolokasi
Kami sangat menyarankan agar Anda menggunakan format berikut untuk variabel geolokasi untuk memastikan bahwa data lokasi Anda berhasil diperkaya.
Variabel | Format | Deskripsi |
---|---|---|
IP_ADDRESS | Alamat IPv4 |
Misalnya - 1.1.1.1 |
BILLING_ZIP dan SHIPPING_ZIP | Kode pos ISO 3166-1 alpha-2 |
Untuk informasi selengkapnya, lihat bagian Kode negara dan wilayah dalam topik ini. |
BILLING_COUNTRY dan SHIPPING_COUNTRY | Kode negara standar ISO 3166-1 alfa-2 |
Untuk informasi selengkapnya, lihat bagian Kode negara dan wilayah dalam topik ini. Amazon Fraud Detector mencoba mencocokkan semua variasi umum nama suatu negara dengan kode negara standar dua huruf ISO 3166-1. Namun, kami tidak dapat menjamin mereka akan dicocokkan dengan benar. |
Tabel berikut menyediakan daftar lengkap negara dan wilayah yang didukung oleh Amazon Fraud Detector untuk pengayaan geolokasi. Setiap negara dan wilayah memiliki kode negara yang ditetapkan (khususnya, kode negara dua huruf ISO 3166-1 alfa-2) dan kode pos.
Format kode pos
9 - nomor
a - surat
[X] - X adalah opsional. Misalnya, Guersney “GY9 [9] 9aa” berarti “GY9 9aa” dan “GY99 9aa” valid. Gunakan satu format.
[X/XX] - X atau XX dapat digunakan. Misalnya, Bermuda “aa [aa/99]” berarti “aa aa” dan “aa 99" valid. Gunakan salah satu dari format ini, tetapi jangan gunakan keduanya.
Beberapa negara memiliki awalan tetap. Misalnya, kode pos untuk Andorra adalah AD999. Ini berarti kode negara harus dimulai dengan huruf AD diikuti oleh tiga angka.
Code | Nama | Kode pos |
---|---|---|
AD | Andorra | AD999 |
AR | Antillen Belanda | 9999 |
DI | Austria | 9999 |
AU | Australia | 9999 |
AZ | Azerbaijan | 9999 |
BD | Bangladesh | 9999 |
ADA | Belgium | 9999 |
BG | Bulgaria | 9999 |
BM | Bermuda | aa [aa/99] |
OLEH | Belarus | 999999 |
CA | Canada | a9a |
CH | Swiss | 9999 |
CL | Chili | 9999999 |
CO | Kolombia | 999999 |
CR | Kosta Rika | 99999 |
CY | Cyprus | 9999 |
CZ | Ceko | 999 99 |
DE | Germany | 99999 |
DK | Denmark | 9999 |
BERBUAT | Republik Dominika | 99999 |
DZ | Aljazair | 99999 |
EE | Estonia | 99999 |
ES | Spain | 99999 |
FI | Finland | 99999 |
FM | Negara Federasi Mikronesia | 99999 |
FO | Kepulauan Faroe | 999 |
FR | France | 99999 |
GB | Britania Raya | sebuah [Sebuah] 9 [Sebuah/9] 9aa |
GG | Guernsey | GY9 [9] 9aa |
GL | Greenland | 9999 |
GP | Guadeloupe | 99999 |
GT | Guatemala | 99999 |
GU | Guam | 99999 |
HR | Croatia | 99999 |
HU | Hungary | 9999 |
YAKNI | Ireland | a99 [A/9] [A/9] [A/9] [A/9] |
IM | Pulau Manusia | IM9 [9] 9aa |
DI DALAM | India | 999999 |
ADALAH | Islandia | 999 |
IA | Italy | 99999 |
JE | Jersey | JE9 [9] 9aa |
JP | Jepang | 999-9999 |
KR | Republik Korea | 99999 |
LI | Liechtenstein | 9999 |
LK | Sri Lanka | 99999 |
LT | Lithuania | 99999 |
LU | Luxembourg | L-9999 |
LV | Latvia | LV-9999 |
MC | Monako | 99999 |
MD | Republik Moldova | 9999 |
MH | Kepulauan Marshall | 99999 |
MK | Makedonia Utara | 9999 |
MP | Kepulauan Mariana Utara | 99999 |
MQ | Matinique | 99999 |
MT | Malta | aaa 9999 |
MX | Meksiko | 99999 |
SAYA | Malaysia | 99999 |
NL | Netherlands | 9999 aa |
TIDAK | Norwegia | 9999 |
NZ | Selandia Baru | 9999 |
PH | Filipina | 9999 |
PK | Pakistan | 99999 |
PL | Poland | 99-999 |
PR | Puerto Riko | 99999 |
PT | Portugal | 9999-999 |
PW | Palau | 99999 |
KEMBALI |
Reuni |
99999 |
RO | Romania | 999999 |
RU | Federasi Rusia | 999999 |
SE | Sweden | 999 99 |
SG | Singapura | 999999 |
SI | Slovenia | 9999 |
SK | Slovakia | 999 99 |
SM | San Marino | 99999 |
TH | Thailand | 99999 |
TR | Turki | 99999 |
UA | Ukraina | 99999 |
US | Amerika Serikat | 99999 |
UY | Uruguay | 99999 |
VI | Kepulauan Virgin, AS | 99999 |
WF | Wallis dan Futuna | 99999 |
YT | Mayotte | 99999 |
ZA | Afrika Selatan | 9999 |
Pengayaan Useragent
Jika Anda membuat model Account Takeover Insights (ATI), Anda harus menyediakan variabel jenis useragent
variabel dalam set data Anda. Variabel ini berisi data browser, perangkat, dan OS dari peristiwa login. Amazon Fraud Detector memperkaya data agen pengguna dengan informasi tambahan seperti, dan. user_agent_family
OS_family
device_family