Einblicke in Transaktionsbetrug - Amazon Fraud Detector

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einblicke in Transaktionsbetrug

Der Modelltyp Transaction Fraud Insights ist darauf ausgelegt, card-not-presentTransaktionsbetrug online oder in zu erkennen. Transaction Fraud Insights ist ein überwachtes Machine-Learning-Modell, was bedeutet, dass historische Beispiele für betrügerische und legitime Transaktionen verwendet werden, um das Modell zu trainieren.

Das Transaction Fraud Insights-Modell verwendet ein Ensemble von Machine Learning-Algorithmen für Datenanreicherung, Transformation und Betrugsklassifizierung. Es nutzt eine Feature-Engine, um Aggregate auf Entitäts- und Ereignisebene zu erstellen. Im Rahmen des Modelltrainingsprozesses fügt Transaction Fraud Insights Rohdatenelemente wie IP-Adresse und BIN-Nummer mit Daten von Drittanbietern wie der Geolokalisierung der IP-Adresse oder der ausstellenden Bank für eine Kreditkarte hinzu. Zusätzlich zu Daten von Drittanbietern verwendet Transaction Fraud Insights Deep-Learning-Algorithmen, die Betrugsmuster berücksichtigen, die bei Amazon beobachtet wurden, und AWS diese Betrugsmuster werden mithilfe eines Gradient-Tree-Boosting-Algorithmus zu Eingabefunktionen für Ihr Modell.

Um die Leistung zu erhöhen, optimiert Transaction Fraud Insights die Hyperparameter des Gradient-Tree-Boosting-Algorithmus über einen Bayesschen Optimierungsprozess, sequenzielles Training von Dutzenden verschiedener Modelle mit unterschiedlichen Modellparametern (z. B. Anzahl der Bäume, Tiefe der Bäume, Anzahl der Stichproben pro Blatt) sowie verschiedene Optimierungsstrategien wie die Gewichtung der Betrügerschaftsgruppen für Nebenbetrug, um sich um sehr niedrige Betrugsraten zu kümmern.

Im Rahmen des Modelltrainingsprozesses berechnet die Feature-Engine des Modells für Transaktionsbetrug Werte für jede eindeutige Entität in Ihrem Trainingsdatensatz, um Betrugsvorhersagen zu verbessern. Während des Trainingsprozesses berechnet und speichert Amazon Fraud Detector beispielsweise das letzte Mal, als eine Entität einen Kauf getätigt hat, und aktualisiert diesen Wert dynamisch bei jedem Aufruf der - GetEventPrediction oder SendEvent-API. Während einer Betrugsvorhersage werden die Ereignisvariablen mit anderen Entitäts- und Ereignismetadaten kombiniert, um vorherzusagen, ob die Transaktion betrügerischer Natur ist.

Auswählen der Datenquelle

Modelle von Transaction Fraud Insights werden nur für Datensätze trainiert, die intern mit Amazon Fraud Detector (INGESTED_EVENTS) gespeichert wurden. Auf diese Weise kann Amazon Fraud Detector die berechneten Werte über die Entitäten, die Sie auswerten, kontinuierlich aktualisieren. Weitere Informationen zu den verfügbaren Datenquellen finden Sie unter . Speicherung der Ereignisdaten

Vorbereiten von Daten

Bevor Sie ein Transaction Fraud Insights-Modell trainieren, stellen Sie sicher, dass Ihre Datendatei alle Header enthält, wie unter Ereignisdatensatz vorbereiten beschrieben. Das Transaction Fraud Insights-Modell vergleicht neue Entitäten, die empfangen werden, mit den Beispielen betrügerischer und legitimer Entitäten im Datensatz. Daher ist es hilfreich, viele Beispiele für jede Entität bereitzustellen.

Amazon Fraud Detector wandelt den gespeicherten Ereignisdatensatz automatisch in das richtige Format für das Training um. Nachdem das Modell das Training abgeschlossen hat, können Sie die Leistungsmetriken überprüfen und bestimmen, ob Sie Ihrem Trainingsdatensatz Entitäten hinzufügen sollten.

Auswählen von Daten

Standardmäßig trainiert Transaction Fraud Insights anhand Ihres gesamten gespeicherten Datensatzes für den von Ihnen ausgewählten Ereignistyp. Sie können optional einen Zeitraum festlegen, um die Ereignisse zu reduzieren, die zum Trainieren Ihres Modells verwendet werden. Stellen Sie beim Festlegen eines Zeitraums sicher, dass die Datensätze, die zum Trainieren des Modells verwendet werden, ausreichend Zeit hatten, um zu reifen. Das bedeutet, dass genügend Zeit verstrichen ist, um sicherzustellen, dass legitime und Betrugsaufzeichnungen korrekt identifiziert wurden. Bei einem Chargeback-Betrug dauert es beispielsweise oft 60 Tage oder mehr, um betrügerische Ereignisse korrekt zu identifizieren. Um eine optimale Modellleistung zu erzielen, stellen Sie sicher, dass alle Datensätze in Ihrem Trainingsdatensatz ausgereift sind.

Es ist nicht erforderlich, einen Zeitraum auszuwählen, der eine ideale Betrugsrate darstellt. Amazon Fraud Detector nimmt automatisch eine Stichprobe Ihrer Daten vor, um ein Gleichgewicht zwischen Betrugsraten, Zeitbereich und Entitätsanzahl zu erreichen.

Amazon Fraud Detector gibt während des Modelltrainings einen Validierungsfehler zurück, wenn Sie einen Zeitraum auswählen, für den nicht genügend Ereignisse vorhanden sind, um ein Modell erfolgreich zu trainieren. Für gespeicherte Datensätze ist das Feld EVENT_LABEL optional, aber Ereignisse müssen beschriftet werden, um in Ihren Trainingsdatensatz aufgenommen zu werden. Bei der Konfiguration Ihres Modelltrainings können Sie wählen, ob Ereignisse ohne Label ignoriert, ein legitimes Label für Ereignisse ohne Label angenommen oder ein betrügerisches Label für Ereignisse ohne Label angenommen werden soll.

Ereignisvariablen

Der zum Trainieren des Modells verwendete Ereignistyp muss mindestens 2 Variablen enthalten, abgesehen von den erforderlichen Ereignismetadaten, die die Datenvalidierung bestanden haben und bis zu 100 Variablen enthalten können. Je mehr Variablen Sie angeben, desto besser kann das Modell zwischen Betrug und legitimen Ereignissen unterscheiden. Obwohl das Transaction Fraud Insight-Modell Dutzende von Variablen unterstützen kann, einschließlich benutzerdefinierter Variablen, empfehlen wir Ihnen, IP-Adresse, E-Mail-Adresse, Zahlungsinstrumenttyp, Bestellpreis und Karten-BIN anzugeben.

Validieren von Daten

Im Rahmen des Trainingsprozesses validiert Transaction Fraud Insights den Trainingsdatensatz auf Datenqualitätsprobleme, die sich auf das Modelltraining auswirken könnten. Nach der Validierung der Daten ergreift Amazon Fraud Detector geeignete Maßnahmen, um das bestmögliche Modell zu erstellen. Dazu gehören die Ausgabe von Warnungen für potenzielle Datenqualitätsprobleme, das automatische Entfernen von Variablen, bei denen Datenqualitätsprobleme auftreten, die Ausgabe eines Fehlers und das Stoppen des Modelltrainingsprozesses. Weitere Informationen finden Sie unter Datensatzvalidierung.

Amazon Fraud Detector gibt eine Warnung aus, setzt das Training eines Modells jedoch fort, wenn die Anzahl der eindeutigen Entitäten kleiner als 1 500 ist, da dies die Qualität der Trainingsdaten beeinträchtigen kann. Wenn Sie eine Warnung erhalten, überprüfen Sie die Leistungsmetrik .