Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Informations sur les fraudes transactionnelles
Le modèle Transaction Fraud Insights est conçu pour détecter les fraudes en ligne ou card-not-present les fraudes transactionnelles. Transaction Fraud Insights est un modèle d'apprentissage automatique supervisé, ce qui signifie qu'il utilise des exemples historiques de transactions frauduleuses et légitimes pour entraîner le modèle.
Le modèle Transaction Fraud Insights utilise un ensemble d'algorithmes d'apprentissage automatique pour l'enrichissement, la transformation et la classification des fraudes des données. Il utilise un moteur d'ingénierie des fonctionnalités pour créer des agrégats au niveau de l'entité et au niveau des événements. Dans le cadre du processus de formation modèle, Transaction Fraud Insights enrichit les éléments de données brutes tels que l'adresse IP et le numéro BIN avec des données tierces telles que la géolocalisation de l'adresse IP ou la banque émettrice d'une carte de crédit. Outre les données tierces, Transaction Fraud Insights utilise des algorithmes d'apprentissage en profondeur qui prennent en compte les modèles de fraude observés sur Amazon. AWS Ces modèles de fraude deviennent des éléments d'entrée de votre modèle à l'aide d'un algorithme de renforcement de l'arborescence des dégradés.
Pour améliorer les performances, Transaction Fraud Insights optimise les hyperparamètres de l'algorithme de renforcement de l'arbre à gradient via un processus d'optimisation bayésien, en formant séquentiellement des dizaines de modèles différents avec différents paramètres de modèle (tels que le nombre d'arbres, la profondeur des arbres, le nombre d'échantillons par feuille) ainsi que différentes stratégies d'optimisation, telles que la surpondération de la population de fraudeurs minoritaire pour réduire les taux de fraude.
Dans le cadre du processus de formation du modèle, le moteur d'ingénierie des fonctionnalités du modèle de fraude transactionnelle calcule des valeurs pour chaque entité unique de votre ensemble de données de formation afin d'améliorer les prévisions de fraude. Par exemple, pendant le processus de formation, Amazon Fraud Detector calcule et enregistre la date du dernier achat effectué par une entité et met à jour cette valeur de manière dynamique chaque fois que vous appelez l'SendEvent
API GetEventPrediction
or. Lors d'une prédiction de fraude, les variables d'événement sont combinées avec d'autres métadonnées d'entités et d'événements pour prédire si la transaction est frauduleuse.
Sélection de la source de données
Les modèles Transaction Fraud Insights sont entraînés uniquement sur un ensemble de données stocké en interne avec Amazon Fraud Detector (INGESTED_EVENTS). Cela permet à Amazon Fraud Detector de mettre à jour en permanence les valeurs calculées concernant les entités que vous évaluez. Pour plus d'informations sur les sources de données disponibles, voir Stockage des données d'événements
Préparation des données
Avant de former un modèle Transaction Fraud Insights, assurez-vous que votre fichier de données contient tous les en-têtes, comme indiqué dans Préparation du jeu de données d'événements. Le modèle Transaction Fraud Insights compare les nouvelles entités reçues aux exemples d'entités frauduleuses et légitimes figurant dans l'ensemble de données. Il est donc utile de fournir de nombreux exemples pour chaque entité.
Amazon Fraud Detector transforme automatiquement le jeu de données d'événements enregistré dans le format approprié pour la formation. Une fois l'entraînement du modèle terminé, vous pouvez consulter les indicateurs de performance et déterminer si vous devez ajouter des entités à votre jeu de données d'entraînement.
Sélection de données
Par défaut, Transaction Fraud Insights s'entraîne sur l'intégralité de votre ensemble de données stocké pour le type d'événement que vous sélectionnez. Vous pouvez éventuellement définir une plage de temps afin de réduire le nombre d'événements utilisés pour entraîner votre modèle. Lorsque vous définissez une plage de temps, assurez-vous que les enregistrements utilisés pour entraîner le modèle ont eu suffisamment de temps pour arriver à maturité. En d'autres termes, suffisamment de temps s'est écoulé pour garantir que les dossiers légitimes et frauduleux ont été correctement identifiés. Par exemple, dans le cas d'une fraude liée à la rétrofacturation, il faut souvent 60 jours ou plus pour identifier correctement les événements frauduleux. Pour optimiser les performances du modèle, assurez-vous que tous les enregistrements de votre jeu de données d'entraînement sont matures.
Il n'est pas nécessaire de sélectionner un intervalle de temps qui représente un taux de fraude idéal. Amazon Fraud Detector échantillonne automatiquement vos données pour trouver un équilibre entre les taux de fraude, la période et le nombre d'entités.
Amazon Fraud Detector renvoie une erreur de validation lors de l'entraînement du modèle si vous sélectionnez une plage de temps pendant laquelle il n'y a pas suffisamment d'événements pour entraîner un modèle avec succès. Pour les ensembles de données stockés, le champ EVENT_LABEL est facultatif, mais les événements doivent être étiquetés pour être inclus dans votre ensemble de données d'entraînement. Lorsque vous configurez votre modèle d'entraînement, vous pouvez choisir d'ignorer les événements non étiquetés, d'utiliser une étiquette légitime pour les événements non étiquetés ou d'utiliser une étiquette frauduleuse pour les événements non étiquetés.
Variables d'événement
Le type d'événement utilisé pour entraîner le modèle doit contenir au moins 2 variables, outre les métadonnées d'événement requises, qui ont passé avec succès la validation des données et peuvent contenir jusqu'à 100 variables. En général, plus vous fournissez de variables, mieux le modèle peut différencier la fraude des événements légitimes. Bien que le modèle Transaction Fraud Insight puisse prendre en charge des dizaines de variables, y compris des variables personnalisées, nous vous recommandons d'inclure l'adresse IP, l'adresse e-mail, le type d'instrument de paiement, le prix de la commande et le BIN de la carte.
Validation des données
Dans le cadre du processus de formation, Transaction Fraud Insights valide l'ensemble de données de formation pour détecter les problèmes de qualité des données susceptibles d'avoir une incidence sur la formation des modèles. Après avoir validé les données, Amazon Fraud Detector prend les mesures appropriées pour créer le meilleur modèle possible. Cela inclut l'émission d'avertissements en cas de problèmes potentiels de qualité des données, la suppression automatique des variables présentant des problèmes de qualité des données ou l'émission d'une erreur et l'arrêt du processus d'apprentissage du modèle. Pour plus d'informations, consultez la section Validation du jeu de données.
Amazon Fraud Detector émettra un avertissement mais continuera à entraîner un modèle si le nombre d'entités uniques est inférieur à 1 500, car cela peut avoir un impact sur la qualité des données de formation. Si vous recevez un avertissement, passez en revue l'indicateur de performance.