Datenquelle auswählen Vorbereiten von Daten Daten auswählen Variablen für Ereignisse Daten werden validiert

Einblicke in Transaktionsbetrug

Der Modelltyp Transaction Fraud Insights dient der Aufdeckung von Online card-not-present - oder Transaktionsbetrug. Transaction Fraud Insights ist ein Modell für überwachtes maschinelles Lernen, was bedeutet, dass es historische Beispiele betrügerischer und legitimer Transaktionen verwendet, um das Modell zu trainieren.

Das Transaction Fraud Insights-Modell verwendet ein Ensemble von Algorithmen für maschinelles Lernen zur Datenanreicherung, Transformation und Betrugsklassifizierung. Es nutzt eine Feature-Engineering-Engine, um Aggregate auf Entitäts- und Ereignisebene zu erstellen. Im Rahmen des Modelltrainingsprozesses reichert Transaction Fraud Insights Rohdatenelemente wie IP-Adresse und BIN-Nummer mit Daten von Drittanbietern an, z. B. der Geolokalisierung der IP-Adresse oder der ausstellenden Bank für eine Kreditkarte. Zusätzlich zu Daten von Drittanbietern verwendet Transaction Fraud Insights Deep-Learning-Algorithmen, die Betrugsmuster berücksichtigen, die bei Amazon beobachtet wurden. AWS Diese Betrugsmuster werden mithilfe eines Gradient Tree-Boosting-Algorithmus zu Eingabefunktionen für Ihr Modell.

Um die Leistung zu steigern, optimiert Transaction Fraud Insights die Hyperparameter des Gradienten-Tree-Boosting-Algorithmus mithilfe eines Bayesschen Optimierungsprozesses. Dabei werden nacheinander Dutzende verschiedener Modelle mit unterschiedlichen Modellparametern (wie Anzahl der Bäume, Tiefe der Bäume, Anzahl der Proben pro Blatt) sowie mit verschiedenen Optimierungsstrategien trainiert, wie z. B. die Gewichtung der betrügerischen Minderheit, um sehr niedrige Betrugsraten zu vermeiden.

Im Rahmen des Modelltrainingsprozesses berechnet die Feature-Engineering-Engine des Transaction Fraud-Modells Werte für jede einzelne Entität in Ihrem Trainingsdatensatz, um Betrugsvorhersagen zu verbessern. Während des Schulungsprozesses berechnet und speichert Amazon Fraud Detector beispielsweise, wann eine Entität das letzte Mal einen Kauf getätigt hat, und aktualisiert diesen Wert dynamisch bei jedem Aufruf der GetEventPrediction SendEvent OR-API. Bei einer Betrugsvorhersage werden die Ereignisvariablen mit anderen Entitäts- und Ereignismetadaten kombiniert, um vorherzusagen, ob die Transaktion betrügerisch ist.

Datenquelle auswählen

Transaction Fraud Insights-Modelle werden nur anhand von Datensätzen trainiert, die intern bei Amazon Fraud Detector (INGESTED_EVENTS) gespeichert wurden. Auf diese Weise kann Amazon Fraud Detector die berechneten Werte der von Ihnen bewerteten Entitäten kontinuierlich aktualisieren. Weitere Informationen zu den verfügbaren Datenquellen finden Sie unter Speicherung von Ereignisdaten

Vorbereiten von Daten

Bevor Sie ein Transaction Fraud Insights-Modell trainieren, stellen Sie sicher, dass Ihre Datendatei alle Header enthält, wie im Ereignisdatensatz vorbereiten beschrieben. Das Transaction Fraud Insights-Modell vergleicht neu eingegangene Entitäten mit den Beispielen für betrügerische und legitime Entitäten im Datensatz. Daher ist es hilfreich, für jede Entität viele Beispiele anzugeben.

Amazon Fraud Detector wandelt den gespeicherten Ereignisdatensatz automatisch in das richtige Format für Schulungen um. Nachdem das Modell das Training abgeschlossen hat, können Sie die Leistungskennzahlen überprüfen und entscheiden, ob Sie Ihrem Trainingsdatensatz Entitäten hinzufügen sollten.

Daten auswählen

Standardmäßig trainiert Transaction Fraud Insights Ihren gesamten gespeicherten Datensatz für den von Ihnen ausgewählten Ereignistyp. Sie können optional einen Zeitraum festlegen, um die Anzahl der Ereignisse zu reduzieren, die zum Trainieren Ihres Modells verwendet werden. Wenn Sie einen Zeitraum festlegen, stellen Sie sicher, dass die Datensätze, die zum Trainieren des Modells verwendet werden, ausreichend Zeit hatten, bis sie ausgereift sind. Das heißt, es ist genügend Zeit vergangen, um sicherzustellen, dass legitime und betrügerische Aufzeichnungen korrekt identifiziert wurden. Beispielsweise dauert es bei Chargeback-Betrug oft 60 Tage oder länger, bis betrügerische Ereignisse korrekt identifiziert sind. Um eine optimale Modellleistung zu erzielen, sollten Sie sicherstellen, dass alle Datensätze in Ihrem Trainingsdatensatz ausgereift sind.

Es ist nicht erforderlich, einen Zeitraum auszuwählen, der einer idealen Betrugsrate entspricht. Amazon Fraud Detector nimmt automatisch Stichproben Ihrer Daten vor, um ein Gleichgewicht zwischen Betrugsraten, Zeitraum und Anzahl der Entitäten zu erreichen.

Amazon Fraud Detector gibt während des Modelltrainings einen Validierungsfehler zurück, wenn Sie einen Zeitraum auswählen, für den nicht genügend Ereignisse vorliegen, um ein Modell erfolgreich zu trainieren. Für gespeicherte Datensätze ist das Feld EVENT_LABEL optional, aber Ereignisse müssen beschriftet werden, um in Ihren Trainingsdatensatz aufgenommen zu werden. Bei der Konfiguration Ihres Modelltrainings können Sie wählen, ob Sie Ereignisse ohne Kennzeichnung ignorieren, ein legitimes Etikett für Ereignisse ohne Etikett oder ein betrügerisches Etikett für Ereignisse ohne Kennzeichnung annehmen möchten.

Variablen für Ereignisse

Der Ereignistyp, der zum Trainieren des Modells verwendet wird, muss neben den erforderlichen Ereignismetadaten mindestens 2 Variablen enthalten, die die Datenvalidierung bestanden haben und bis zu 100 Variablen enthalten können. Generell gilt: Je mehr Variablen Sie angeben, desto besser kann das Modell zwischen Betrug und legitimen Ereignissen unterscheiden. Obwohl das Transaction Fraud Insight-Modell Dutzende von Variablen, einschließlich benutzerdefinierter Variablen, unterstützen kann, empfehlen wir Ihnen, die IP-Adresse, die E-Mail-Adresse, die Art des Zahlungsinstruments, den Bestellpreis und die Karten-BIN anzugeben.

Daten werden validiert

Im Rahmen des Trainingsprozesses validiert Transaction Fraud Insights den Trainingsdatensatz auf Datenqualitätsprobleme, die sich auf das Modelltraining auswirken könnten. Nach der Validierung der Daten ergreift Amazon Fraud Detector geeignete Maßnahmen, um das bestmögliche Modell zu erstellen. Dazu gehören das Ausgeben von Warnungen vor potenziellen Datenqualitätsproblemen, das automatische Entfernen von Variablen mit Datenqualitätsproblemen oder das Ausgeben eines Fehlers und das Stoppen des Modelltrainingsprozesses. Weitere Informationen finden Sie unter Validierung von Datensätzen.

Amazon Fraud Detector gibt eine Warnung aus, trainiert das Modell jedoch weiter, wenn die Anzahl der eindeutigen Entitäten weniger als 1.500 beträgt, da dies die Qualität der Trainingsdaten beeinträchtigen kann. Wenn Sie eine Warnung erhalten, überprüfen Sie die Leistungskennzahl.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Einblicke in Online-Betrug

Einblicke in die Kontoübernahme