Variablen - Amazon Fraud Detector

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Variablen

Variablen stellen Datenelemente dar, die Sie in einer Betrugsprognose verwenden möchten. Diese Variablen können dem Ereignisdatensatz entnommen werden, den Sie für das Training Ihres Modells vorbereitet haben, aus den Risikobewertungsdaten Ihres Amazon Fraud Detector-Modells oder aus SageMaker Amazon-Modellen. Weitere Hinweise zu Variablen aus dem Event-Dataset finden Sie unterRufen Sie die Anforderungen für Ereignisdatensätze mit dem Datenmodell-Explorer ab.

Die Variablen, die Sie in Ihrer Betrugsprognose verwenden möchten, müssen zuerst erstellt und dann dem Ereignis hinzugefügt werden, wenn Sie Ihren Ereignistyp erstellen. Jeder Variablen, die Sie erstellen, muss ein Datentyp, ein Standardwert und optional ein Variablentyp zugewiesen werden. Amazon Fraud Detector erweitert einige der von Ihnen bereitgestellten Variablen wie IP-Adressen, Bankidentifikationsnummern (BINs) und Telefonnummern, um zusätzliche Eingaben zu erstellen und die Leistung der Modelle zu steigern, die diese Variablen verwenden.

Datentypen

Variablen müssen einen Datentyp für das Datenelement haben, das die Variable darstellt, und sie können optional einem der vordefinierten Datentypen zugewiesen werdenVariablentypen. Für Variablen, die einem Variablentyp zugewiesen sind, ist der Datentyp vorausgewählt. Zu den möglichen Datentypen gehören die folgenden Typen:

Datentyp Beschreibung Standardwert Beispielwerte
Zeichenfolge Beliebige Kombination aus Buchstaben, ganzen Zahlen oder beidem <empty>

abc, 123, 1D3B

Ganzzahl Positive oder negative ganze Zahlen 0 1, -1
Boolesch Wahr oder Falsch Falsch Wahr, Falsch
DateTime Datum und Uhrzeit sind nur im UTC-Format nach ISO 8601 angegeben <empty> 2019-11-30T 13:01:01 Z
Gleitkommazahl Zahlen mit Dezimalstellen 0.0 4,01, 0,10

Standardwert

Variablen müssen einen Standardwert haben. Wenn Amazon Fraud Detector Betrugsprognosen generiert, wird dieser Standardwert verwendet, um eine Regel oder ein Modell auszuführen, falls Amazon Fraud Detector keinen Wert für eine Variable erhält. Die von Ihnen angegebenen Standardwerte müssen dem ausgewählten Datentyp entsprechen. In der AWS-Konsole weist Amazon Fraud Detector den Standardwert von 0 für Ganzzahlen, für Boolesche Werte, false für Fließkommazahlen und (leer) 0.0 für Zeichenketten zu. Sie können für jeden dieser Datentypen einen benutzerdefinierten Standardwert festlegen.

Variablentypen

Wenn Sie eine Variable erstellen, können Sie die Variable optional einem Variablentyp zuweisen. Der Variablentyp stellt die allgemeinen Datenelemente dar, die zum Trainieren von Modellen und zur Generierung von Betrugsprognosen verwendet werden. Nur Variablen mit einem zugehörigen Variablentyp können für das Modelltraining verwendet werden. Als Teil des Modelltrainingsprozesses verwendet Amazon Fraud Detector den mit der Variablen verknüpften Variablentyp, um Variablenanreicherungen, Feature-Engineering und Risikobewertungen durchzuführen.

Amazon Fraud Detector hat die folgenden Variablentypen vordefiniert, die verwendet werden können, um sie Ihren Variablen zuzuweisen.

Kategorie Variablentyp Beschreibung Datentyp Beispiel
Sitzung IP_ADDRESS Die IP-Adresse, die während der Veranstaltung gesammelt wurde Zeichenfolge 192.0.2.0

Hinweis: Amazon Fraud Detector reichert diese Daten an. Weitere Informationen finden Sie unter Anreicherung der Geolokalisierung

BENUTZERAGENT Der Benutzeragent, der während der Veranstaltung gesammelt wurde Zeichenfolge Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv: 68.0) Gecko 20100101
FINGERABDRUCK Die eindeutige Kennung für ein Gerät, das für die Veranstaltung verwendet wird Zeichenfolge sadfow987u234
SESSION_ID Die Sitzungs-ID für die aktive Sitzung des Events Zeichenfolge sid 123456789
SIND_ANMELDEINFORMATIONEN GÜLTIG Gibt an, ob die für die Event-Anmeldung verwendeten Anmeldeinformationen gültig sind Boolesch Wahr
Benutzer EMAIL_ADRESSE Die E-Mail-Adresse, die während der Veranstaltung gesammelt wurde Zeichenfolge abc@domain.com
PHONE_NUMBER Die während der Veranstaltung gesammelte Telefonnummer Zeichenfolge +1 555-0100

Hinweis: Amazon Fraud Detector reichert diese Daten an. Weitere Informationen finden Sie unter Anreicherung von Telefonnummern

Fakturierung ABRECHNUNGSNAME Der Name, der mit der Rechnungsadresse verknüpft ist Zeichenfolge Hans Muster
ABRECHNUNGSTELEFON Die Telefonnummer, die mit der Rechnungsadresse verknüpft ist Zeichenfolge +1 555-0100

Hinweis: Amazon Fraud Detector reichert diese Daten an. Weitere Informationen finden Sie unter Anreicherung von Telefonnummern

RECHNUNGSADRESSE_L1 Die erste Zeile der Rechnungsadresse Zeichenfolge Jede Straße
RECHNUNGSADRESSE_L2 Die zweite Zeile der Rechnungsadresse Zeichenfolge Jede Einheit 123
BILLING_CITY Die Stadt, die in der Rechnungsadresse steht Zeichenfolge Beliebige Stadt
ABRECHNUNGSSTATUS Der Bundesstaat oder die Provinz, der in der Rechnungsadresse steht Zeichenfolge Jeder Bundesstaat oder jede Provinz
ABRECHNUNGSLAND Das Land, das in der Rechnungsadresse steht Zeichenfolge Irgendein Land

Hinweis: Amazon Fraud Detector reichert diese Daten an. Weitere Informationen finden Sie unter Anreicherung der Geolokalisierung

ABRECHNUNG_ZIP Die Postleitzahl, die in der Rechnungsadresse steht Zeichenfolge 01234

Hinweis: Amazon Fraud Detector reichert diese Daten an. Weitere Informationen finden Sie unter Anreicherung der Geolokalisierung

Versand VERSANDNAME Der Name, der mit der Lieferadresse verknüpft ist Zeichenfolge Hans Muster
VERSANDNUMMER Die Telefonnummer, die mit der Lieferadresse verknüpft ist Zeichenfolge +1 555-0100

Hinweis: Amazon Fraud Detector reichert diese Daten an. Weitere Informationen finden Sie unter Anreicherung von Telefonnummern

LIEFERADRESSE_L1 Die erste Zeile der Lieferadresse Zeichenfolge 123 Any Street
LIEFERADRESSE_L2 Die zweite Zeile der Lieferadresse Zeichenfolge Einheit 123
VERSANDSTADT Die Stadt, die in der Lieferadresse steht Zeichenfolge Beliebige Stadt
VERSANDSTATUS Der Bundesstaat oder die Provinz, der in der Lieferadresse steht Zeichenfolge Irgendein Bundesstaat
LIEFERLAND Das Land, in dem sich das befindet, steht in der Lieferadresse Zeichenfolge Irgendein Land

Hinweis: Amazon Fraud Detector reichert diese Daten an. Weitere Informationen finden Sie unter Anreicherung der Geolokalisierung

VERSAND_ZIP Die Postleitzahl, die in der Lieferadresse steht Zeichenfolge 01234

Hinweis: Amazon Fraud Detector reichert diese Daten an. Weitere Informationen finden Sie unter Anreicherung der Geolokalisierung

Payment (Zahlung) ORDER_ID Die eindeutige Kennung für die Transaktion Zeichenfolge LUX 60
PREIS Der Gesamtbestellpreis Zeichenfolge 560,00
WÄHRUNGSCODE Der ISO-4217-Währungscode Zeichenfolge USD
ZAHLUNGSART Die Zahlungsmethode, die für die Zahlung während der Veranstaltung verwendet wird Zeichenfolge Kreditkarte
AUTH_CODE Der alphanumerische Code, der von einem Kreditkartenaussteller oder einer ausstellenden Bank gesendet wird Zeichenfolge 0000
AVS Der Antwortcode des Adressverifikationssystems (AVS) vom Kartenprozessor Zeichenfolge Y
Produkt PRODUKT_KATEGORIE Die Produktkategorie des Bestellartikels Zeichenfolge Küche
Benutzerdefiniert NUMERIC Jede Variable, die als reelle Zahl dargestellt werden kann Gleitkommazahl 1.224
CATEGORICAL Jede Variable, die Kategorien, Segmente oder Gruppen beschreibt Zeichenfolge Large (Groß)
FREIE_FORMULAR_TEXT Jeder Freiformtext, der im Rahmen der Veranstaltung erfasst wurde (z. B. eine Kundenbewertung oder ein Kommentar) Zeichenfolge Beispiel für eine Texteingabe in freier Form

Variablen einem Variablentyp zuweisen

Wenn Sie planen, eine Variable für das Training Ihres Modells zu verwenden, ist es wichtig, dass Sie den richtigen Variablentyp auswählen, der der Variablen zugewiesen wird. Eine falsche Zuweisung von Variablentypen kann sich negativ auf Ihre Modellleistung auswirken. Es kann für Sie auch sehr schwierig werden, die Zuweisung später zu ändern, insbesondere wenn mehrere Modelle und Ereignisse die Variable verwendet haben.

Sie können Ihrer Variablen einen der vordefinierten Variablentypen oder einen der benutzerdefinierten Variablentypen zuweisen —FREE_FORM_TEXT,CATEGORICAL, oderNUMERIC.

Wichtige Hinweise zur Zuordnung von Variablen zu den richtigen Variablentypen

  1. Wenn die Variable einem der vordefinierten Variablentypen entspricht, verwenden Sie sie. Stellen Sie sicher, dass der Variablentyp der Variablen entspricht. Wenn Sie beispielsweise eine ip_address-Variable einem Variablentyp zuweisen, wird die EMAIL_ADDRESS Variable ip_address nicht mit Anreicherungen wie ASN, ISP, Geolokalisierung und Risikobewertung angereichert. Weitere Informationen finden Sie unter Variable Anreicherungen.

  2. Wenn die Variable keinem der vordefinierten Variablentypen entspricht, folgen Sie den unten aufgeführten Empfehlungen, um einen der benutzerdefinierten Variablentypen zuzuweisen.

  3. Weisen Sie CATEGORICAL Variablen, die normalerweise keine natürliche Reihenfolge haben und in Kategorien, Segmente oder Gruppen unterteilt werden können, einen Variablentyp zu. Der Datensatz, den Sie zum Trainieren Ihres Modells verwenden, kann ID-Variablen wie merchant_id, campaign_id oder policy_id enthalten. Diese Variablen stellen Gruppen dar (zum Beispiel stehen alle Kunden mit derselben Policy_ID für eine Gruppe). Variablen mit den folgenden Daten muss der Variablentyp CATEGORICAL zugewiesen werden -

    • Variablen, die Daten wie Customer_ID, Segment_ID, Color_ID, Department_Code oder Product_ID enthalten.

    • Variablen, die boolesche Daten mit den Werten „Wahr“, „Falsch“ oder „Null“ enthalten.

    • Variablen, die in Gruppen oder Kategorien wie Firmenname, Produktkategorie, Kartentyp oder Empfehlungsmedium eingeteilt werden können.

    Anmerkung

    ENTITY_IDist ein reservierter Variablentyp, der von Amazon Fraud Detector verwendet wird, um einer ENTITY_ID-Variablen zuzuweisen. Die Variable ENTITY_ID ist die ID der Entität, die die Aktion initiiert, die Sie auswerten möchten. Wenn Sie einen Transaction Fraud Insight (TFI) -Modelltyp erstellen, müssen Sie die Variable ENTITY_ID angeben. Sie müssen entscheiden, welche Variable in Ihren Daten die Entität, die die Aktion initiiert, eindeutig identifiziert und sie als ENTITY_ID-Variable weiterleiten. Weisen Sie allen anderen IDs in Ihrem Datensatz den Variablentyp CATEGORICAL zu, sofern sie vorhanden sind und Sie sie für das Modelltraining verwenden. Beispiele für andere IDs, die keine Entität in Ihrem Datensatz sind, können Merchant_ID, Policy_ID und Campaign_ID sein.

  4. Weisen Sie FREE_FORM_TEXT Variablen, die einen Textblock enthalten, einen Variablentyp zu. Beispiele für FREE_FORM_TEXT-Variablentypen sind — Benutzerrezensionen, Kommentare, Daten und Empfehlungscodes. Die FREE_FORM_TEXT-Daten enthalten mehrere Token, die durch ein Trennzeichen getrennt sind. Bei den Trennzeichen kann es sich um ein beliebiges Zeichen mit Ausnahme von alphanumerischen Zeichen und Unterstrichen handeln. Beispielsweise können Benutzerrezensionen und Kommentare durch ein Leerzeichen getrennt werden, Daten und Empfehlungscodes können Bindestriche als Trennzeichen verwenden, um Präfix, Suffix und dazwischen liegende Teile voneinander zu trennen. Amazon Fraud Detector verwendet die Trennzeichen, um Daten aus FREE_FORM_TEXT-Variablen zu extrahieren.

  5. Weisen Sie Variablen, die reelle Zahlen sind und eine inhärente Reihenfolge haben, den Variablentyp NUMERIC zu. Beispiele für NUMERISCHE Variablen sind day_of_the_week, incident_severity, customer_rating. Sie können diesen Variablen zwar den Variablentyp CATEGORICAL zuweisen, es wird jedoch dringend empfohlen, alle reellen Zahlen mit inhärenter Reihenfolge dem Variablentyp NUMERIC zuzuweisen.

Variable Anreicherungen

Amazon Fraud Detector erweitert einige der von Ihnen bereitgestellten Rohdatenelemente wie IP-Adressen, Bank-Identifikationsnummern (BINs) und Telefonnummern, um zusätzliche Eingaben zu erstellen und die Leistung der Modelle zu steigern, die diese Datenelemente verwenden. Die Anreicherung hilft dabei, potenziell verdächtige Situationen zu identifizieren und den Modellen zu helfen, mehr Betrugsfälle zu erkennen.

Anreicherung von Telefonnummern

Amazon Fraud Detector reichert die Telefonnummerndaten mit zusätzlichen Informationen an, die sich auf den Standort, den ursprünglichen Mobilfunkanbieter und die Gültigkeit der Telefonnummer beziehen. Die Anreicherung von Telefonnummern wird automatisch für alle Models aktiviert, die am oder nach dem 13. Dezember 2021 trainiert wurden und deren Telefonnummer eine Landesvorwahl (+xxx) enthält. Wenn Sie eine Rufnummernvariable in Ihr Modell aufgenommen und es vor dem 13. Dezember 2021 trainiert haben, schulen Sie Ihr Modell neu, damit es diese Erweiterung nutzen kann.

Wir empfehlen Ihnen dringend, das folgende Format für Telefonnummernvariablen zu verwenden, um sicherzustellen, dass Ihre Daten erfolgreich angereichert werden.

Variable Format Beschreibung
PHONE_NUMBER Der E.164-Standard Achten Sie darauf, die Landesvorwahl (+xxx) bei der Telefonnummer anzugeben.
BILLING_PHONE und SHIPPING_PHONE Der E.164-Standard Achten Sie darauf, die Landesvorwahl (+xxx) bei der Telefonnummer anzugeben.

Anreicherung der Geolokalisierung

Ab dem 8. Februar 2022 berechnet Amazon Fraud Detector die physische Entfernung zwischen den Werten IP_ADDRESS, BILLING_ZIP und SHIPPING_ZIP, die Sie für ein Ereignis angeben. Die berechneten Entfernungen werden als Eingaben für Ihr Betrugserkennungsmodell verwendet.

Um die Geolocation Enrichment zu aktivieren, müssen Ihre Eventdaten mindestens zwei der drei Variablen enthalten: IP_ADDRESS, BILLING_ZIP oder SHIPPING_ZIP. Darüber hinaus muss jeder BILLING_ZIP- und SHIPPING_ZIP-Wert jeweils einen gültigen BILLING_COUNTRY-Code bzw. SHIPPING_COUNTRY-Code haben. Wenn Sie ein Modell haben, das vor dem 8. Februar 2022 trainiert wurde und es diese Variablen enthält, müssen Sie das Modell neu trainieren, um die Geolokationsanreicherung zu ermöglichen.

Wenn Amazon Fraud Detector den Standort, der mit den IP_ADDRESS-, BILLING_ZIP- oder SHIPPING_ZIP-Werten für ein Ereignis verknüpft ist, nicht ermitteln kann, weil die Daten ungültig sind, wird stattdessen ein spezieller Platzhalterwert verwendet. Nehmen wir beispielsweise an, dass ein Ereignis gültige IP_ADDRESS- und BILLING_ZIP-Werte hat, der Wert SHIPPING_ZIP jedoch nicht gültig ist. In diesem Fall erfolgt die Anreicherung nur für IP_ADDRESS—> BILLING_ZIP. Die Anreicherung erfolgt nicht für IP_ADDRESS—>SHIPPING_ZIP und BILLING_ZIP—>SHIPPING_ZIP. Stattdessen werden die Platzhalterwerte an ihrer Stelle verwendet. Unabhängig davon, ob die Geolocation Enrichment für Ihr Modell aktiviert ist oder nicht, die Leistung Ihres Modells ändert sich nicht.

Sie können die Geolokationsanreicherung deaktivieren, indem Sie Ihre Variablen BILLING_ZIP und SHIPPING_ZIP dem Variablentyp CUSTOM_CATEGORICAL zuordnen. Eine Änderung des Variablentyps wirkt sich nicht auf die Leistung Ihres Modells aus.

Variablenformat für Geolokalisierung

Wir empfehlen Ihnen dringend, das folgende Format für Geolokalisierungsvariablen zu verwenden, um sicherzustellen, dass Ihre Standortdaten erfolgreich angereichert werden.

Variable Format Beschreibung
IP_ADDRESS IPv4-Adresse Zum Beispiel - 1.1.1.1
BILLING_ZIP und SHIPPING_ZIP Die ISO 3166-1 Alpha-2-Postleitzahl für das angegebene Land Weitere Informationen finden Sie im Abschnitt Länder- und Gebietsvorwahlen in diesem Thema.
BILLING_COUNTRY und SHIPPING_COUNTRY Der zweibuchstabige Standard-Ländercode nach ISO 3166-1 Alpha-2 Weitere Informationen finden Sie im Abschnitt Länder- und Gebietsvorwahlen in diesem Thema. Amazon Fraud Detector versucht, alle gängigen Varianten des Namens eines Landes dem aus zwei Buchstaben bestehenden ISO-3166-1-Standard-Ländercode zuzuordnen. Wir können jedoch nicht garantieren, dass sie korrekt zugeordnet werden.

Die folgende Tabelle enthält eine vollständige Liste der Länder und Gebiete, die von Amazon Fraud Detector für die Anreicherung von Geolokationen unterstützt werden. Jedem Land und Gebiet ist ein Ländercode (insbesondere der zweibuchstabige Ländercode nach ISO 3166-1 Alpha-2) und eine Postleitzahl zugewiesen.

Format der Postleitzahl

  • 9 - Zahl

  • a - Buchstabe

  • [X] - X ist optional. Guersney „GY9 [9] 9aa“ bedeutet beispielsweise, dass sowohl „GY9 9aa“ als auch „GY99 9aa“ gültig sind. Verwenden Sie ein Format.

  • [X/XX] — entweder X oder XX können verwendet werden. Zum Beispiel bedeutet Bermuda „aa [aa/99]“, dass sowohl „aa aa“ als auch „aa 99" gültig sind. Verwenden Sie eines dieser Formate, aber nicht beide.

  • Einige Länder haben ein festes Präfix. Die Postleitzahl für Andorra ist beispielsweise AD999. Das bedeutet, dass die Landesvorwahl mit den Buchstaben AD beginnen muss, gefolgt von drei Zahlen.

Code Name PLZ
AD Andorra AD999
AR Niederländische Antillen 9999
AT Österreich 9999
AU Australien 9999
AZ Aserbaidschan AB 999
BD Bangladesch 9999
BE Belgien 9999
BG Bulgarien 9999
BM Bermuda aa [aa/99]
BY Belarus 999999
CA Kanada a9a 9a9
CH Schweiz 9999
CL Chile 9999999
CO Kolumbien 999999
CR Costa Rica 99999
CY Zypern 9999
CZ Tschechien 99 99
DE Deutschland 99999
DK Dänemark 9999
DO Dominikanische Republik 99999
DZ Algerien 99999
EE Estland 99999
ES Spanien 99999
FI Finnland 99999
FM Föderierte Staaten von Mikronesien 99999
FO Färöer-Inseln 999
FR Frankreich 99999
GB Großbritannien und Nordirland [a] 9 [a/9] 9aa
GG Guernsey GY9 [9] 9aa
GL Grönland 9999
GP Guadeloupe 99999
GT Guatemala 99999
GU Guam 99999
HR Kroatien 99999
HU Ungarn 9999
IE Irland a99 [a/9] [a/9] [a/9] [a/9]
IM Isle of Man IM9 [9] 9aa
IN Indien 999999
IS Island 999
IT Italien 99999
JE Jersey JE9 [9] 9aa
JP Japan 999-9999
KR Republik Korea 99999
LI Liechtenstein 9999
LK Sri Lanka 99999
LT Litauen 99999
LU Luxemburg L-999
LV Lettland LV-9999
MC Monaco 99999
MD Republik Moldawien 9999
MH Marshallinseln 99999
MK Nordmazedonien 9999
MP Nördliche Marianen 99999
MQ Matinique 99999
MT Malta aaa 999
MX Mexiko 99999
MY Malaysia 99999
NL Niederlande 999 aa
NO Norwegen 9999
NZ Neuseeland 9999
PH Philippinen 9999
PK Pakistan 99999
PL Polen 99-999
PR Puerto Rico 99999
PT Portugal 9999-999
PW Palau 99999
RE

Wiedersehen

99999
RO Rumänien 999999
RU Russische Föderation 999999
SE Schweden 99 99
SG Singapur 999999
SI Slowenien 9999
SK Slowakei 99 99
SM San Marino 99999
TH Thailand 99999
TR Türkei 99999
UA Ukraine 99999
USA Vereinigte Staaten 99999
UY Uruguay 99999
VI Amerikanische Jungferninseln 99999
WF Wallis und Futuna 99999
YT Mayotte 99999
ZA Südafrika 9999

Anreicherung durch Useragent

Wenn Sie das Account Takeover Insights (ATI) -Modell erstellen, müssen Sie eine useragent Variable des Variablentyps in Ihrem Datensatz angeben. Diese Variable enthält die Browser-, Geräte- und Betriebssystemdaten eines Anmeldeereignisses. Amazon Fraud Detector reichert die Useragent-Daten mit zusätzlichen Informationen wie user_agent_familyOS_family, und an. device_family