Variables - Amazon Fraud Detector

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Variables

Les variables représentent les éléments de données que vous souhaitez utiliser dans une prévision de fraude. Ces variables peuvent être extraites de l'ensemble de données d'événements que vous avez préparé pour entraîner votre modèle, des résultats des scores de risque de votre modèle Amazon Fraud Detector ou des SageMaker modèles Amazon. Pour plus d'informations sur les variables extraites du jeu de données d'événements, consultezObtenez les exigences relatives aux ensembles de données d'événements à l'aide de l'explorateur de modèles.

Les variables que vous souhaitez utiliser dans vos prévisions de fraude doivent d'abord être créées, puis ajoutées à l'événement lors de la création de votre type d'événement. Chaque variable que vous créez doit se voir attribuer un type de données, une valeur par défaut et éventuellement un type de variable. Amazon Fraud Detector enrichit certaines des variables que vous fournissez, telles que les adresses IP, les numéros d'identification bancaire (BIN) et les numéros de téléphone, afin de créer des entrées supplémentaires et d'améliorer les performances des modèles qui utilisent ces variables.

Types de données

Les variables doivent avoir un type de données pour l'élément de données qu'elles représentent et peuvent éventuellement se voir attribuer l'un des types prédéfinisTypes de variables. Pour les variables affectées à un type de variable, le type de données est présélectionné. Les types de données possibles incluent les types suivants :

Type de données Description Valeur par défaut Exemples de valeur
Chaîne N'importe quelle combinaison de lettres, de chiffres entiers ou des deux <empty>

abc, 123 ans, 1D3B

Entier Nombres entiers positifs ou négatifs 0 1, -1
Booléen Vrai ou faux False Vrai, Faux
DateTime Date et heure spécifiées uniquement au format UTC de la norme ISO 8601 <empty> 2019-11-30T 13:01:01 Z
Float Nombres avec virgule décimale 0.0 4,01, 0,10

Valeur par défaut

Les variables doivent avoir une valeur par défaut. Lorsqu'Amazon Fraud Detector génère des prévisions de fraude, cette valeur par défaut est utilisée pour exécuter une règle ou un modèle si Amazon Fraud Detector ne reçoit aucune valeur pour une variable. Les valeurs par défaut que vous fournissez doivent correspondre au type de données sélectionné. Dans la console AWS, Amazon Fraud Detector attribue la valeur par défaut 0 pour les entiers, pour les booléens, false pour les flottants et (vide) 0.0 pour les chaînes. Vous pouvez définir une valeur par défaut personnalisée pour n'importe lequel de ces types de données.

Types de variables

Lorsque vous créez une variable, vous pouvez éventuellement l'affecter à un type de variable. Le type de variable représente les éléments de données courants utilisés pour former des modèles et générer des prévisions de fraude. Seules les variables associées à un type de variable peuvent être utilisées pour l'apprentissage du modèle. Dans le cadre du processus de formation du modèle, Amazon Fraud Detector utilise le type de variable associé à la variable pour effectuer des enrichissements variables, une ingénierie des fonctionnalités et une évaluation des risques.

Amazon Fraud Detector a prédéfini les types de variables suivants qui peuvent être utilisés pour les attribuer à vos variables.

Catégorie Type de variable Description Type de données Exemple
Session IP_ADDRESS L'adresse IP collectée lors de l'événement Chaîne 192,2.0

Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement de la géolocalisation.

AGENT UTILISATEUR L'agent utilisateur collecté lors de l'événement Chaîne Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv:68.0) Gecko 20100101
EMPREINTE DIGITALE L'identifiant unique d'un appareil utilisé pour l'événement Chaîne sadfow987u234
SESSION_ID L'ID de session pour la session active de l'événement Chaîne sid123456789
LES INFORMATIONS D'IDENTIFICATION SONT-ELLES VALIDES Indique si les informations d'identification utilisées pour la connexion aux événements sont valides Booléen True
Utilisateur ADRESSE_E-MAIL L'adresse e-mail collectée lors de l'événement Chaîne abc@domain.com
PHONE_NUMBER Le numéro de téléphone collecté lors de l'événement Chaîne +1 555-0100

Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement du numéro de téléphone.

Facturation NOM_DE FACTURATION Le nom associé à l'adresse de facturation Chaîne Jean Dupont
TÉLÉPHONE DE FACTURATION Le numéro de téléphone associé à l'adresse de facturation Chaîne +1 555-0100

Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement du numéro de téléphone.

ADRESSE_DE FACTURATION_L1 La première ligne de l'adresse de facturation Chaîne N'importe quelle rue
ADRESSE_DE FACTURATION_L2 La deuxième ligne de l'adresse de facturation Chaîne N'importe quelle unité 123
BILLING_CITY La ville indiquée dans l'adresse de facturation Chaîne N'importe quelle ville
ÉTAT DE FACTURATION État ou province indiqué dans l'adresse de facturation Chaîne N'importe quel État ou province
PAYS_DE_FACTURATION Le pays indiqué dans l'adresse de facturation Chaîne N'importe quel pays

Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement de la géolocalisation.

ZIP DE FACTURATION Le code postal qui se trouve dans l'adresse de facturation Chaîne 01234

Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement de la géolocalisation.

Expédition NOM_D'EXPÉDITION Le nom associé à l'adresse de livraison Chaîne Jean Dupont
TÉLÉPHONE D'EXPÉDITION Le numéro de téléphone associé à l'adresse de livraison Chaîne +1 555-0100

Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement du numéro de téléphone.

ADRESSE_DE LIVRAISON_L1 La première ligne de l'adresse de livraison Chaîne 123 Any Street
ADRESSE_DE LIVRAISON_L2 La deuxième ligne de l'adresse de livraison Chaîne Unité 123
VILLE_D'EXPÉDITION La ville indiquée dans l'adresse de livraison Chaîne N'importe quelle ville
ÉTAT_D'EXPÉDITION État ou province indiqué dans l'adresse de livraison Chaîne N'importe quel État
PAYS_D'EXPÉDITION Le pays dans lequel se trouve l'adresse de livraison Chaîne N'importe quel pays

Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement de la géolocalisation.

ZIP_D'EXPÉDITION Le code postal qui se trouve dans l'adresse de livraison Chaîne 01234

Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement de la géolocalisation.

Paiement IDENTIFIANT_COMMANDE L'identifiant unique de la transaction Chaîne LUX60
PRIX Le prix total de la commande Chaîne 560,00
CODE_DEVISE Le code de devise ISO 4217 Chaîne USD
TYPE_DE PAIEMENT Le mode de paiement utilisé pour le paiement lors de l'événement Chaîne Carte de crédit
CODE D'AUTHENTIFICATION Le code alphanumérique envoyé par l'émetteur de la carte de crédit ou la banque émettrice Chaîne 0000
AVS Le code de réponse du système de vérification d'adresse (AVS) émis par le processeur de la carte Chaîne Y
Produit CATÉGORIE_PRODUIT La catégorie de produit de l'article commandé Chaîne Cuisine
Personnalisé NUMERIC Toute variable pouvant être représentée sous forme de nombre réel Float 1,224
CATEGORICAL (catégorie) Toute variable décrivant des catégories, des segments ou des groupes Chaîne Large
TEXTE_FORMULAIRE LIBRE Tout texte en format libre capturé dans le cadre de l'événement (par exemple, un avis ou un commentaire d'un client) Chaîne Exemple de saisie de texte sous forme libre

Affectation d'une variable à un type de variable

Si vous envisagez d'utiliser une variable pour entraîner votre modèle, il est important que vous choisissiez le type de variable approprié à affecter à la variable. Une attribution incorrecte du type de variable peut avoir un impact négatif sur les performances de votre modèle. Il peut également s'avérer très difficile de modifier l'affectation ultérieurement, en particulier si plusieurs modèles et événements ont utilisé la variable.

Vous pouvez attribuer à votre variable l'un des types de variables prédéfinis ou l'un des types de variables personnalisés —FREE_FORM_TEXT,CATEGORICAL, ouNUMERIC.

Remarques importantes concernant l'affectation de variables aux bons types de variables

  1. Si la variable correspond à l'un des types de variables prédéfinis, utilisez-la. Assurez-vous que le type de variable correspond à la variable. Par exemple, si vous attribuez une variable ip_address à un type de variable, la EMAIL_ADDRESS variable ip_address ne sera pas enrichie par des enrichissements tels que l'ASN, l'ISP, la géolocalisation et le score de risque. Pour plus d'informations, veuillez consulter Enrichissements variables.

  2. Si la variable ne correspond à aucun type de variable prédéfini, suivez les recommandations ci-dessous pour attribuer l'un des types de variables personnalisés.

  3. Attribuez un type de CATEGORICAL variable à des variables qui n'ont généralement pas d'ordre naturel et qui peuvent être placées dans des catégories, des segments ou des groupes. Le jeu de données que vous utilisez pour entraîner votre modèle peut contenir des variables d'identification telles que merchant_id, campaign_id ou policy_id. Ces variables représentent des groupes (par exemple, tous les clients ayant le même policy_id représentent un groupe). Les variables contenant les données suivantes doivent se voir attribuer le type de variable CATEGORICAL -

    • Variables contenant des données telles que Customer_ID, Segment_ID, Color_ID, department_code ou Product_ID.

    • Variables contenant des données booléennes avec des valeurs vraies, fausses ou nulles.

    • Variables pouvant être placées dans des groupes ou des catégories telles que le nom de l'entreprise, la catégorie de produit, le type de carte ou le support de référence.

    Note

    ENTITY_IDest un type de variable réservé utilisé par Amazon Fraud Detector pour attribuer à la variable ENTITY_ID. La variable ENTITY_ID est l'ID de l'entité qui lance l'action que vous souhaitez évaluer. Si vous créez un type de modèle Transaction Fraud Insight (TFI), vous devez fournir la variable ENTITY_ID. Vous devrez décider quelle variable de vos données identifie de manière unique l'entité à l'origine de l'action et la transmettre en tant que variable ENTITY_ID. Attribuez le type de variable CATEGORICAL à tous les autres ID de votre jeu de données, s'ils sont présents et si vous les utilisez pour l'apprentissage du modèle. Parmi les autres identifiants qui ne constituent pas une entité dans votre jeu de données, citons Merchant_ID, Policy_ID et Campaign_ID.

  4. Attribuez un type de FREE_FORM_TEXT variable aux variables qui contiennent un bloc de texte. Voici des exemples de types de variables FREE_FORM_TEXT : les avis des utilisateurs, les commentaires, les dates et les codes de référence. Les données FREE_FORM_TEXT contiennent plusieurs jetons séparés par un délimiteur. Les délimiteurs peuvent être n'importe quel caractère autre que le caractère alphanumérique et le trait de soulignement. Par exemple, les avis et les commentaires des utilisateurs peuvent être séparés par un séparateur « espace », tandis que les dates et les codes de référence peuvent utiliser des traits d'union comme délimiteurs pour séparer le préfixe, le suffixe et les parties intermédiaires. Amazon Fraud Detector utilise les délimiteurs pour extraire les données des variables FREE_FORM_TEXT.

  5. Attribuez le type de variable NUMÉRIQUE aux variables qui sont des nombres réels et qui ont un ordre inhérent. Des exemples de variables NUMERIC incluent day_of_the_week, incident_severity, customer_rating. Bien que vous puissiez attribuer le type de variable CATEGORICAL à ces variables, nous vous recommandons vivement d'attribuer toutes les variables numériques avec un ordre inhérent au type de variable NUMÉRIQUE.

Enrichissements variables

Amazon Fraud Detector enrichit certains éléments de données brutes que vous fournissez, tels que les adresses IP, les numéros d'identification bancaire (BIN) et les numéros de téléphone, afin de créer des entrées supplémentaires et d'améliorer les performances des modèles qui utilisent ces éléments de données. L'enrichissement permet d'identifier les situations potentiellement suspectes et aide les modèles à détecter davantage de fraudes.

Enrichissement du numéro de téléphone

Amazon Fraud Detector enrichit les données relatives aux numéros de téléphone avec des informations supplémentaires relatives à la géolocalisation, à l'opérateur d'origine et à la validité du numéro de téléphone. L'enrichissement des numéros de téléphone est automatiquement activé pour tous les modèles qui sont formés le 13 décembre 2021 ou après cette date et dont le numéro de téléphone inclut un code de pays (+xxx). Si vous avez inclus une variable de numéro de téléphone dans votre modèle et que vous l'avez entraînée avant le 13 décembre 2021, réentraînez votre modèle afin qu'il puisse tirer parti de cet enrichissement.

Nous vous recommandons vivement d'utiliser le format suivant pour les variables de numéro de téléphone afin de garantir un enrichissement réussi de vos données.

Variable Format Description
PHONE_NUMBER La norme E.164 Assurez-vous d'inclure le code du pays (+xxx) avec le numéro de téléphone.
BILLING_PHONE et SHIPPING_PHONE La norme E.164 Assurez-vous d'inclure le code du pays (+xxx) avec le numéro de téléphone.

Enrichissement de la géolocalisation

À compter du 8 février 2022, Amazon Fraud Detector calcule la distance physique entre les valeurs IP_ADDRESS, BILLING_ZIP et SHIPPING_ZIP que vous fournissez pour un événement. Les distances calculées sont utilisées comme entrées dans votre modèle de détection des fraudes.

Pour permettre l'enrichissement de la géolocalisation, les données de votre événement doivent inclure au moins deux des trois variables : IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP. En outre, chaque valeur BILLING_ZIP et SHIPPING_ZIP doit comporter respectivement un code BILLING_COUNTRY et un code SHIPPING_COUNTRY valides. Si votre modèle a été entraîné avant le 8 février 2022 et qu'il inclut ces variables, vous devez réentraîner le modèle pour permettre l'enrichissement par géolocalisation.

Si Amazon Fraud Detector ne parvient pas à déterminer l'emplacement associé aux valeurs IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP pour un événement en raison de la non-validité des données, une valeur d'espace réservé spéciale est utilisée à la place. Supposons, par exemple, qu'un événement possède des valeurs IP_ADDRESS et BILLING_ZIP valides, mais que la valeur SHIPPING_ZIP ne l'est pas. Dans ce cas, l'enrichissement est effectué uniquement pour IP_ADDRESS—> BILLING_ZIP. L'enrichissement n'est pas effectué pour IP_ADDRESS—>SHIPPING_ZIP et BILLING_ZIP—>SHIPPING_ZIP. Au lieu de cela, les valeurs des espaces réservés sont utilisées à leur place. Que l'enrichissement par géolocalisation soit activé ou non pour votre modèle, les performances de votre modèle ne changent pas.

Vous pouvez désactiver l'enrichissement par géolocalisation en mappant vos variables BILLING_ZIP et SHIPPING_ZIP au type de variable CUSTOM_CATEGORICAL. La modification du type de variable n'affecte pas les performances de votre modèle.

Format variable de géolocalisation

Nous vous recommandons vivement d'utiliser le format suivant pour les variables de géolocalisation afin de vous assurer que vos données de localisation sont correctement enrichies.

Variable Format Description
IP_ADDRESS Adresse IPv4 Par exemple - 1.1.1.1
BILLING_ZIP et SHIPPING_ZIP Le code postal ISO 3166-1 alpha-2 du pays spécifié Pour plus d'informations, consultez la section Codes de pays et de territoires de cette rubrique.
BILLING_COUNTRY et SHIPPING_COUNTRY Le code de pays standard à deux lettres ISO 3166-1 alpha-2 Pour plus d'informations, consultez la section Codes de pays et de territoires de cette rubrique. Amazon Fraud Detector essaie de faire correspondre toutes les variantes courantes du nom d'un pays à son code de pays standard à deux lettres ISO 3166-1. Cependant, nous ne pouvons pas garantir qu'ils seront correctement mis en correspondance.

Le tableau suivant fournit une liste complète des pays et territoires pris en charge par Amazon Fraud Detector pour l'enrichissement de la géolocalisation. Chaque pays et territoire est associé à un code de pays (en particulier, le code de pays à deux lettres ISO 3166-1 alpha-2) et à un code postal.

Format du code postal

  • 9 - numéro

  • une - lettre

  • [X] - X est facultatif. Par exemple, « GY9 [9] 9aa » de Guersney signifie que « GY9 9aa » et « GY99 9aa » sont valides. Utilisez un seul format.

  • [X/XX] : vous pouvez utiliser X ou XX. Par exemple, « aa [aa/99] » des Bermudes signifie que « aa aa » et « aa 99 » sont valides. Utilisez l'un de ces formats, mais pas les deux.

  • Certains pays ont un préfixe fixe. Par exemple, le code postal d'Andorre est AD999. Cela signifie que le code du pays doit commencer par les lettres AD suivies de trois chiffres.

Code Nom Code postal
AD Andorre ANNONCE 999
AR Antilles néerlandaises 9999
AT Autriche 9999
AU Australie 9999
AZ Azerbaïdjan COMME 9999
BD Bangladesh 9999
ÊTRE Belgique 9999
SAC Bulgarie 9999
BM Bermudes aa [aa/99]
BY Biélorussie 999999
CA Canada a9a 9a9
CHAP Suisse 9999
CL Chili 9999999
CO Colombie 999999
CR Costa Rica 99999
CY Chypre 9999
RÉPUBLIQUE TCHÈQUE Tchéquie 99 99
DE Allemagne 99999
DK Danemark 9999
DO République Dominicaine 99999
DZ Algérie 99999
EE Estonie 99999
ES Espagne 99999
FI Finlande 99999
FM États fédérés de Micronésie 99999
POUR Iles Féroé 999
FR France 99999
Go Royaume-Uni [a] 9 [a/9] 9aa
GG Guernesey GY9 [9] 9aa
GRAND LIVRE Groenland 9999
GRAND PRIX Guadeloupe 99999
GT Guatemala 99999
GU Guam 99999
HR Croatie 99999
HU Hongrie 9999
IE Irlande a99 [a/9] [a/9] [a/9]
IM Île de Man IM9 [9] 9aa
IN Inde 999999
IS Islande 999
IL Italie 99999
JE Jersey JE9 [9] 9aa
JP Japon 999-9999
KR République de Corée 99999
LI Liechtenstein 9999
LK Sri Lanka 99999
LT Lituanie 99999
LU Luxembourg L-9999
LV Lettonie LV-9999
MAÎTRE DES CÉRÉMONIES Monaco 99999
MARYLAND République de Moldova 9999
MH Îles Marshall 99999
MK Macédoine du Nord 9999
MP Îles Mariannes du Nord 99999
MQ Matinique 99999
MT Malte aaa 999
MX Mexique 99999
MON Malaisie 99999
NL Pays-Bas 999 aa
NO Norvège 9999
NZ Nouvelle-Zélande 9999
PH Philippines 9999
PK Pakistan 99999
PL Pologne 99-999
PR Porto Rico 99999
PT Portugal 9999-999
PW Palaos 99999
RE

Réunion

99999
RO Roumanie 999999
RU Fédération de Russie 999999
SE Suède 99 99
SG Singapour 999999
SI Slovénie 9999
SK Slovaquie 99 99
HM Saint-Marin 99999
TH Thaïlande 99999
TR Turquie 99999
UA Ukraine 99999
ETATS-UNIS États-Unis 99999
BUY Uruguay 99999
VI Iles Vierges américaines 99999
WF Wallis-et-Futuna 99999
YT Mayotte 99999
ZA Afrique du Sud 9999

Enrichissement des agents utilisateurs

Si vous créez le modèle Account Takeover Insights (ATI), vous devez fournir une variable du type de useragent variable dans votre jeu de données. Cette variable contient les données du navigateur, de l'appareil et du système d'exploitation d'un événement de connexion. Amazon Fraud Detector enrichit les données utilisateur/agent avec des informations supplémentaires telles que user_agent_familyOS_family, et. device_family