Variables - Amazon Fraud Detector

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Variables

變數代表您要在詐騙預測中使用的資料元素。這些變數可從您為訓練模型準備的事件資料集、Amazon 詐騙偵測器模型的風險分數輸出或 Amazon 模SageMaker型中擷取。如需有關從事件資料集取得之變數的詳細資訊,請參閱使用資料模型總管取得事件資料集需求

您必須先建立您要用於詐騙預測的變數,然後在建立事件類型時新增至事件中。您建立的每個變數都必須指派資料類型、預設值,以及選擇性的變數類型。Amazon 詐騙偵測器會豐富您提供的某些變數,例如 IP 位址、銀行識別號碼 (BIN) 和電話號碼,以建立其他輸入並提升使用這些變數的模型效能。

資料類型

變數必須具有變數所代表之資料元素的資料類型,並且可以選擇性地指派其中一個預先定義的變數變數類型。對於指派給變數類型的變數,會預先選取資料類型。可能的資料類型包括下列類型:

資料類型 描述 預設值 範例值
字串 字母、整數或兩者的任意組合 <empty>

ABC, 123, 1 日

整數 正整數或負數 0 1, -1
Boolean 真或假 False 真假
DateTime 僅以 ISO 8601 標準世界標準格式指定的日期和時間 <empty> 2019-11-30T13:01:01Z
Float 帶有小數點的數字 0.0 4.01

預設值

變數必須具有預設值。當 Amazon 詐騙偵測器產生詐騙預測時,如果 Amazon 詐騙偵測器未收到變數的值,則會使用此預設值執行規則或模型。您提供的預設值必須與選取的資料類型相符。在 AWS 主控台中,Amazon 詐騙偵測器會0為整數、布林值、false浮點數和字串 (空白) 指派預設值。0.0您可以為任何這些資料類型設定自訂預設值。

變數類型

當您建立變數時,您可以選擇性地將變數指派給變數類型。變數類型代表用來訓練模型和產生詐騙預測的常見資料元素。只有具有關聯變數類型的變數才能用於模型訓練。做為模型訓練程序的一部分,Amazon 詐騙偵測器會使用與變數關聯的變數類型來執行變數擴充、功能工程和風險評分。

Amazon 詐騙偵測器已預先定義下列可用於指派給變數的變數類型。

類別 變數類型 描述 資料類型 範例
Session (工作階段) IP_ADDRESS 活動期間收集的 IP 位址 字串 192.0.2.0

注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 地理位置豐富

用戶代理 在事件期間收集的使用者代理程式 字串 Mozilla 5.0 (視窗新界 10.0, 64, RV: 68.0) 壁虎
指紋 用於事件之裝置的唯一識別碼 字串 薩德福烏
SESSION_ID 事件作用中工作階段的工作階段 ID 字串 sid123456789
是有效的憑證 指出用於事件登入的認證是否有效 Boolean True
使用者 電子郵件地址 活動期間收集的電子郵件地址 字串 abc@domain.com
PHONE_NUMBER 活動期間收集的電話號碼 字串 +1 555-0100

注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 電話號碼豐富

帳單 帳單名稱 與帳單地址相關聯的名稱 字串 约翰·杜
帳單電話 與帳單地址相關聯的電話號碼 字串 +1 555-0100

注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 電話號碼豐富

帳單地址 帳單地址的第一行 字串 任何街道
帳單地址 帳單地址的第二行 字串 任何單位 123
帳單城市 帳單地址中的城市 字串 任何城市
帳單狀態 帳單地址中的州或省 字串 任何州或省
帳單國家 帳單地址中的國家/地區 字串 任何國家

注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 地理位置豐富

帳單拉鍊 帳單地址中的郵遞區號 字串 01234

注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 地理位置豐富

運費 出貨名稱 與運送地址相關聯的名稱 字串 约翰·杜
運送電話 與運送地址相關聯的電話號碼 字串 +1 555-0100

注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 電話號碼豐富

運送地址 _L1 送貨地址的第一行 字串 任何街道
運送地址 _L2 送貨地址的第二行 字串 第 123 單元
運送城市 運送地址中的城市 字串 任何城市
運送狀態 運送地址中的州或省 字串 任何州
運送國家 運送地址中的國家/地區 字串 任何國家

注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 地理位置豐富

出貨 _ 拉鍊 運送地址中的郵遞區號 字串 01234

注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 地理位置豐富

付款 訂單識別碼 交易的唯一識別碼 字串 LUX60
價格 總訂單價格 字串 560.00
貨幣代碼 新加坡貨幣代碼 字串 USD
付款類型 活動期間用於付款的付款方式 字串 信用卡
驗證碼 信用卡發卡機構或發卡銀行所傳送的英文字母代碼 字串 0000
AVS 記憶卡處理器的位址驗證系統 (AVS) 回應碼 字串 Y
產品 產品類別 訂單項目的產品類別 字串 廚房
自訂 NUMERIC 任何可以表示為實數的變數 Float 1.224
CATEGORICAL 描述類別、區段或群組的任何變數 字串 大型
自由格式文字 作為活動一部分擷取的任何自由格式文字 (例如,客戶評論或留言) 字串 自由格式文本輸入的示例

將變量分配給變量類型

如果您打算使用變數來訓練模型,請務必選擇正確的變數類型來指派給變數。不正確的變數類型指派可能會對模型效能產生負面影響。對於稍後更改分配也會變得非常困難,特別是如果多個模型和事件使用了該變量。

您可以為變數指派任何一種預先定義的變數類型或其中一個自訂變數類型 — FREE_FORM_TEXT CATEGORICAL、或NUMERIC

將變數指派給正確變數類型的重要注意事項

  1. 如果變數與其中一個預先定義的變數類型相符,請使用它。請確定變數類型對應於變數。例如,如果您將 ip_address 變數指派給EMAIL_ADDRESS變數類型,則 ip_address 變數將不會充實豐富,例如 ASN、ISP、地理位置和風險評分。如需詳細資訊,請參閱變數豐富

  2. 如果變數與任何預先定義的變數類型不相符,請遵循下列建議指派其中一個自訂變數類型。

  3. CATEGORICAL變數類型指派給通常沒有自然順序且可以放入類別、區段或群組的變數。您用來訓練模型的資料集可能具有 ID 變數,例如,商業識別碼、活動識別碼或政策識別碼這些變數代表群組 (例如,具有相同政策_id 的所有客戶代表一個群組)。具有以下數據的變量必須分配分類變量類型-

    • 包含客戶識別碼、區段 ID、顏色 ID 、部門代碼或產品 ID 等資料的變數。

    • 包含具有真、假或空值之布林值資料的變數。

    • 可以放入群組或類別的變數,例如公司名稱、產品類別、卡片類型或推薦媒介。

    注意

    ENTITY_ID是亞馬遜欺詐檢測器用於分配給 ENTITY_ID 變量的保留變量類型。ENTITY_ID 變數是啟動您要評估之動作的實體識別碼。如果您要建立交易詐騙洞察 (TFI) 模型類型,則必須提供 ENTITY_ID 變數。您將需要決定數據中的哪個變量唯一標識起始操作的實體,並將其作為 ENTITY_ID 變量傳遞。如果資料集中的所有其他 ID 存在,以及您是否使用它們進行模型訓練,請將 CATEGORICAL 變數類型指派給資料集中的所有其他 ID。其他不是資料集中實體的 ID 範例可以是商業 ID、政策識別碼和促銷活動 ID

  4. FREE_FORM_TEXT變數類型指派給包含文字區塊的變數。FREE_FORM_TEXT 變數類型的範例包括 — 使用者評論、註解日期和推薦代碼。FREE_FORM_TEXT 資料包含多個以分隔符號分隔的記號。分隔符可以是字母數字和下劃線符號以外的任何字符。例如,用戶評論和評論可以用「空格」分隔符分隔,日期和推薦代碼可以使用連字符作為分隔符來分隔出前綴,後綴和中間部分。亞馬遜詐騙偵測器使用分隔符號從 FREE_FORM_TEXT 變數擷取資料。

  5. NUMERIC 變數類型指派給實數且具有固有排序的變數。NUMERIC 變數的範例包括週的日期、事件嚴重性、客戶評級。雖然您可以將 CATEGORIAL 變數類型指派給這些變數,但我們強烈建議您將所有具有固有順序的實數變數指派給 NUMERIC 變數類型。

變數豐富

Amazon 詐騙偵測器可豐富您提供的某些原始資料元素,例如 IP 位址、銀行識別號碼 (BIN) 和電話號碼,以建立額外的輸入並提升使用這些資料元素的模型效能。強化功能有助於識別潛在的可疑情況,並幫助模型捕獲更多欺詐行為。

電話號碼豐富

Amazon 詐騙偵測器會使用與地理位置、原始電信業者和電話號碼有效性相關的其他資訊來豐富電話號碼資料。所有在 2021 年 12 月 13 日或之後接受訓練且電話號碼包含國家/地區代碼 (+xxx) 的型號,都會自動啟用電話號碼強化功能。如果您已在模型中包含電話號碼變數,並且在 2021 年 12 月 13 日之前對其進行了訓練,請重新訓練模型,以便它可以利用此擴充功能。

我們強烈建議您對電話號碼變數使用以下格式,以確保資料能夠成功豐富。

變數 格式 描述
PHONE_NUMBER 國際標準 確保在電話號碼中包含國家/地區代碼(+xxx)。
電話和運費 _ 電話 國際標準 確保在電話號碼中包含國家/地區代碼(+xxx)。

地理位置豐富

2022 年 2 月 8 日開始,亞馬遜欺詐偵測器會計算您為事件提供的 IP_ADDRESS、BILLING_ZIP 和運送 _ZIP 值之間的實際距離。計算出的距離會用作詐騙偵測模型的輸入。

若要啟用地理位置擴充功能,您的事件資料必須至少包含下列三個變數中的兩個:IP_ADDRESS、BILLING_ZIP 或出貨。此外,每個郵遞區號和運送郵遞區號必須分別具有有效的帳單國家代碼和運送國家代碼。如果您擁有在 2022 年 2 月 8 日之前進行訓練的模型,且其中包含這些變數,則必須重新訓練模型以啟用地理位置擴充。

如果由於資料無效,亞馬遜詐騙偵測器無法判斷事件的 IP_ADDRESS、BILLING_ZIP 或出貨值相關聯的位置,則會改用特殊的預留位置值。例如,假設事件具有有效的 IP_ADDRESS 和比林格 ZIP 值,但出貨 _ ZIP 值無效。在此情況下,僅針對 IP 位址 —> 帳單 ZIP 進行豐富。IP 位址 —> 郵遞區號和帳單郵遞區號-> 出貨 _ 郵遞不會完成豐富作業。取而代之的是,佔位符值用於它們的位置。無論您的模型是否啟用了地理位置擴充功能,模型的效能都不會改變。

您可以通過將您的 BILLING_ZIP 和運輸變量映射到自定義分類變量類型來選擇退出地理位置擴充。變更變數類型不會影響模型的效能。

地理位置變量格式

我們強烈建議您對地理位置變數使用以下格式,以確保您的位置資料能夠成功充實。

變數 格式 描述
IP_ADDRESS IPv4 位址 舉個例子-1.1.1.1
拉鍊和郵編付運輸 指定國家/地區的 ISO 3166-1 字母 2 字母郵遞區號 如需詳細資訊,請參閱本主題中的國家和地區代碼一節。
帳單國家及運送國家 兩個字母的標準國家代碼 如需詳細資訊,請參閱本主題中的國家和地區代碼一節。Amazon 詐騙偵測器會嘗試將國家/地區名稱的所有常見變體與 ISO 3166-1 兩個字母的標準國家/地區代碼相符。但是,我們不能保證它們會被正確匹配。

下表提供 Amazon 詐騙偵測器支援用於擴充地理位置的國家和地區的完整清單。每個國家和地區都有一個指定的國家/地區代碼(特別是 ISO 3166-1 字母 2 字母的兩個字母的國家/地區代碼)和一個郵政編碼。

郵遞區號格式

  • 9-號碼

  • 一個-字母

  • [X]-X 是可選的。例如,格爾斯尼「GY9 [9] 9aa」意味著「GY9 9 AA」和「GY99 9aa」都是有效的。使用一種格式。

  • [X/XX]-可以使用 X 或 XX。例如,百慕達「aa [aa/99]」意味著「AA AA」和「AA 99」均為有效。請使用下列其中一種格式,但不要同時使用兩種格式。

  • 某些國家/地區有固定的前綴 例如,安道爾的郵遞區號為 AD999。這意味著國家/地區代碼必須以 AD 字母開頭,後跟三個數字。

Code 名稱 郵政編碼
廣告 安道爾 AD999
AR 荷屬安地列斯 9999
AT 奧地利 9999
AU 澳洲 9999
AZ 亞塞拜然 AZ
BD 孟加拉 9999
比利時 9999
BG 保加利亞 9999
BM 百慕達 AA [aa/99]
BY 白俄羅斯 999999
CA 加拿大 a9a
CH 瑞士 9999
CL 智利 9999999
CO 哥倫比亞 999999
CR 哥斯大黎加 99999
CY 賽普勒斯 9999
鋯石 捷克 999 99
DE 德國 99999
DK 丹麥 9999
DO 多明尼加共和國 99999
DZ 阿爾及利亞 99999
EE 愛沙尼亞 99999
ES 西班牙 99999
FI 芬蘭 99999
FM 密克罗尼西亚联邦 99999
FO 法羅群島 999
法國 法國 99999
GB 英國 一個 [一] 9 [A/9] 9aa
GG 根西島 GY9 [9] 9 節
GL 格陵蘭 9999
GP 瓜地洛普 99999
GT 瓜地馬拉 99999
關島 99999
小時 克羅埃西亞 99999
匈牙利 9999
IE 愛爾蘭 一九九 [A/9] [A/9] [a/9] [a/9]
曼島 IM9 [9] 9AA
IN 印度 999999
IS 冰島 999
義大利 99999
流行性 澤西島 JE9 [9] 9
JP 日本 999-9999
KR 大韓民國 99999
列支敦斯登 9999
LK 斯里蘭卡 99999
LT 立陶宛 99999
盧森堡 L-9999
LV 拉脫維亞 LV-9999
MC 摩納哥 99999
MD 摩尔多瓦共和国 9999
MH 馬紹爾群島 99999
MK 北馬其頓 9999
MP 北马里亚纳群岛 99999
MQ 馬提尼克 99999
馬爾他 AAA 9999
MX 墨西哥 99999
我的 馬來西亞 99999
NL 荷蘭 九九九
NO 挪威 9999
NZ 紐西蘭 9999
酸鹼度 菲律賓 9999
PK 巴基斯坦 99999
PL 波蘭 99-999
PR 波多黎各 99999
PT 葡萄牙 9999-999
PW 帛琉 99999
回覆

團圓

99999
RO 羅馬尼亞 999999
俄罗斯联邦 999999
SE 瑞典 999 99
SG 新加坡 999999
SI 斯洛維尼亞 9999
SK 斯洛伐克 999 99
SM 聖馬利諾 99999
泰國 99999
TR 土耳其 99999
UA 烏克蘭 99999
美國 美國 99999
UY 烏拉圭 99999
美屬維京群島 99999
WF 瓦利斯和富圖納群島 99999
YT 馬約特島 99999
ZA 南非 9999

使用者代理程式豐富

如果您建立帳戶接管見解 (ATI) 模型,則必須在資料集中提供useragent變數類型的變數。此變數包含登入事件的瀏覽器、裝置和作業系統資料。Amazon 詐騙偵測器透過其他資訊 (例如user_agent_familyOS_family、和) 來豐富使用者代理程式資料。device_family