Variáveis - Amazon Fraud Detector

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Variáveis

As variáveis representam elementos de dados que você deseja usar em uma previsão de fraude. Essas variáveis podem ser obtidas do conjunto de dados do evento que você preparou para treinar seu modelo, dos resultados da pontuação de risco do seu modelo do Amazon Fraud Detector ou dos modelos da Amazon. SageMaker Para obter mais informações sobre variáveis retiradas do conjunto de dados do evento, consulteObtenha os requisitos do conjunto de dados de eventos usando o Data Models Explorer.

As variáveis que você deseja usar em sua previsão de fraude devem primeiro ser criadas e depois adicionadas ao evento ao criar seu tipo de evento. Cada variável criada deve receber um tipo de dados, um valor padrão e, opcionalmente, um tipo de variável. O Amazon Fraud Detector enriquece algumas das variáveis que você fornece, como endereços IP, números de identificação bancária (BINs) e números de telefone, para criar entradas adicionais e aumentar o desempenho dos modelos que usam essas variáveis.

Tipos de dados

As variáveis devem ter um tipo de dados para o elemento de dados que a variável representa e, opcionalmente, podem ser atribuídos a um dos predefinidosTipos de variáveis. Para variáveis atribuídas a um tipo de variável, o tipo de dados é pré-selecionado. Os tipos de dados possíveis incluem os seguintes tipos:

Tipo de dados Descrição Valor padrão Exemplos de valores
String Qualquer combinação de letras, números inteiros ou ambos <empty>

abc, 123, 13DB

Inteiro Números inteiros positivos ou negativos 0 1, -1
Booliano Verdadeiro ou falso Falso Verdadeiro, falso
DateTime Data e hora especificadas somente no formato UTC padrão ISO 8601 <empty> 30/11/2019 ÀS 13:01:01 Z
Float Números com pontos decimais 0.0 4,01, 0,10

Valor padrão

As variáveis devem ter um valor padrão. Quando o Amazon Fraud Detector gera previsões de fraude, esse valor padrão é usado para executar uma regra ou modelo se o Amazon Fraud Detector não receber um valor para uma variável. Os valores padrão fornecidos devem corresponder ao tipo de dados selecionado. No console da AWS, o Amazon Fraud Detector atribui o valor padrão de 0 para números inteiros, para booleanos, false para flutuadores e (vazio) 0.0 para cadeias de caracteres. Você pode definir um valor padrão personalizado para qualquer um desses tipos de dados.

Tipos de variáveis

Ao criar uma variável, você pode, opcionalmente, atribuir a variável a um tipo de variável. O tipo de variável representa os elementos de dados comuns usados para treinar modelos e gerar previsões de fraude. Somente variáveis com um tipo de variável associado podem ser usadas para o treinamento do modelo. Como parte do processo de treinamento do modelo, o Amazon Fraud Detector usa o tipo de variável associado à variável para realizar enriquecimentos variáveis, engenharia de recursos e pontuação de risco.

O Amazon Fraud Detector predefiniu os seguintes tipos de variáveis que podem ser usados para atribuir às suas variáveis.

Categoria Tipo de variável Descrição Tipo de dados Exemplo
Sessão IP_ADDRESS O endereço IP que é coletado durante o evento String 192.0.2.0

Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento da geolocalização.

AGENTE DE USUÁRIO O agente de usuário que é coletado durante o evento String Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv: 68.0) Gecko 20100101
IMPRESSÃO DIGITAL O identificador exclusivo de um dispositivo usado para o evento String sadfow987u234
SESSION_ID O ID da sessão ativa do evento String sid123456789
SÃO_CREDENTIALS_VÁLIDAS Indica se as credenciais usadas para o login do evento são válidas Booliano Verdadeiro
Usuário ENDEREÇO DE E-MAIL O endereço de e-mail coletado durante o evento String abc@domain.com
PHONE_NUMBER O número de telefone coletado durante o evento String +1 555-0100

Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone.

Faturamento NOME_DO_FATURAMENTO O nome associado ao endereço de cobrança String John Doe
TELEFONE DE COBRANÇA O número de telefone associado ao endereço de cobrança String +1 555-0100

Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone.

ENDEREÇO_DE_FATURAMENTO_L1 A primeira linha do endereço de cobrança String Qualquer rua
ENDEREÇO_DE_FATURAMENTO_L2 A segunda linha do endereço de cobrança String Qualquer unidade 123
CIDADE DE COBRANÇA A cidade que está no endereço de cobrança String Qualquer cidade
ESTADO DE COBRANÇA O estado ou província que está no endereço de cobrança String Qualquer estado ou província
PAÍS_DE_FATURAMENTO O país que está no endereço de cobrança String Qualquer país

Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento da geolocalização.

COBRANÇA_ZIP O código postal que está no endereço de cobrança String 01234

Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento da geolocalização.

Remessa NOME_DE_ENVIO O nome associado ao endereço de entrega String John Doe
TELEFONE_DE_ENVIO O número de telefone associado ao endereço de entrega String +1 555-0100

Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone.

ENDEREÇO_DE_FRETE_L1 A primeira linha do endereço de entrega String 123 Any Street
ENDEREÇO_DE_ENVIO_L2 A segunda linha do endereço de entrega String Unidade 123
CIDADE_EXPEDIÇÃO A cidade que está no endereço de entrega String Qualquer cidade
ESTADO_DE_ENVIO O estado ou província que está no endereço de entrega String Qualquer estado
PAÍS_DE_ENVIO O país que está no endereço de entrega String Qualquer país

Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento da geolocalização.

SHIPPING_ZIP O código postal que está no endereço de entrega String 01234

Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento da geolocalização.

Pagamento ID_DO PEDIDO O identificador exclusivo da transação String LUX60
PREÇO O preço total do pedido String 560,00
CÓDIGO_DA_MOEDA O código de moeda ISO 4217 String USD
TIPO_DE_PAGAMENTO A forma de pagamento usada para pagamento durante o evento String Cartão de crédito
CÓDIGO_FONTE O código alfanumérico enviado por um emissor de cartão de crédito ou banco emissor String 0000
AVS O código de resposta do sistema de verificação de endereço (AVS) do processador do cartão String Y
Produto CATEGORIA_PRODUTO A categoria de produto do item do pedido String Cozinha
Personalizar NUMERIC Qualquer variável que possa ser representada como um número real Float 1.224
CATEGORICAL Qualquer variável que descreva categorias, segmentos ou grupos String Grande
TEXTO_EM FORMATO LIVRE Qualquer texto de formato livre que seja capturado como parte do evento (por exemplo, uma avaliação ou comentário de um cliente) String Exemplo de entrada de texto em formato livre

Atribuindo variável a um tipo de variável

Se você planeja usar uma variável para treinar seu modelo, é importante escolher um tipo de variável correto para atribuir à variável. A atribuição incorreta do tipo de variável pode afetar negativamente o desempenho do seu modelo. Também pode ser muito difícil alterar a atribuição posteriormente, especialmente se vários modelos e eventos tiverem usado a variável.

Você pode atribuir à sua variável qualquer um dos tipos de variáveis predefinidos ou um dos tipos de variáveis personalizadas —FREE_FORM_TEXT,CATEGORICAL, ou. NUMERIC

Notas importantes para atribuir variáveis aos tipos de variáveis corretos

  1. Se a variável corresponder a um dos tipos de variáveis predefinidos, use-a. Certifique-se de que o tipo de variável corresponda à variável. Por exemplo, se você atribuir uma variável ip_address ao tipo de variável, a EMAIL_ADDRESS variável ip_address não será enriquecida com enriquecimentos como ASN, ISP, localização geográfica e pontuação de risco. Para obter mais informações, consulte Enriquecimentos variáveis.

  2. Se a variável não corresponder a nenhum dos tipos de variáveis predefinidos, siga as recomendações listadas abaixo para atribuir um dos tipos de variáveis personalizadas.

  3. Atribua o tipo de CATEGORICAL variável a variáveis que normalmente não têm ordem natural e podem ser colocadas em categorias, segmentos ou grupos. O conjunto de dados que você está usando para treinar seu modelo pode ter variáveis de ID como merchant_id, campaign_id ou policy_id. Essas variáveis representam grupos (por exemplo, todos os clientes com o mesmo policy_id representam um grupo). As variáveis que têm os seguintes dados devem ser atribuídas ao tipo de variável CATEGÓRICA -

    • Variáveis que contêm dados como Customer_ID, Segment_ID, Color_ID, department_code ou Product_ID.

    • Variáveis que contêm dados booleanos com valores verdadeiros, falsos ou nulos.

    • Variáveis que podem ser colocadas em grupos ou categorias, como nome da empresa, categoria do produto, tipo de cartão ou meio de referência.

    nota

    ENTITY_IDé um tipo de variável reservada usado pelo Amazon Fraud Detector para atribuir à variável ENTITY_ID. A variável ENTITY_ID é a ID da entidade que está iniciando a ação que você deseja avaliar. Se você estiver criando um tipo de modelo Transaction Fraud Insight (TFI), precisará fornecer a variável ENTITY_ID. Você precisará decidir qual variável em seus dados identifica de forma exclusiva a entidade que está iniciando a ação e passá-la como variável ENTITY_ID. Atribua o tipo de variável CATEGÓRICA a todos os outros IDs em seu conjunto de dados, se eles estiverem presentes e se você os estiver usando para treinamento de modelos. Exemplos de outras IDs que não são uma entidade em seu conjunto de dados podem ser Merchant_ID, Policy_ID e Campaign_ID.

  4. Atribua o tipo de FREE_FORM_TEXT variável às variáveis que contêm um bloco de texto. Exemplos de tipos de variáveis FREE_FORM_TEXT são: avaliações de usuários, comentários, datas e códigos de referência. Os dados FREE_FORM_TEXT contêm vários tokens separados por um delimitador. Os delimitadores podem ser qualquer caractere diferente do símbolo alfanumérico e sublinhado. Por exemplo, avaliações e comentários de usuários podem ser separados por um delimitador de “espaço”, datas e códigos de referência podem usar hífens como delimitadores para separar prefixo, sufixo e partes intermediárias. O Amazon Fraud Detector usa os delimitadores para extrair dados das variáveis FREE_FORM_TEXT.

  5. Atribua o tipo de variável NUMERIC a variáveis que são números reais e têm ordenação inerente. Exemplos de variáveis NUMÉRICAS incluem day_of_the_week, incident_severity, customer_rating. Embora você possa atribuir o tipo de variável CATEGÓRICA a essas variáveis, é altamente recomendável atribuir todas as variáveis de número real com ordem inerente ao tipo de variável NUMERIC.

Enriquecimentos variáveis

O Amazon Fraud Detector enriquece alguns dos elementos de dados brutos que você fornece, como endereços IP, números de identificação bancária (BINs) e números de telefone, para criar entradas adicionais e aumentar o desempenho dos modelos que usam esses elementos de dados. O enriquecimento ajuda a identificar situações potencialmente suspeitas e ajuda os modelos a capturar mais fraudes.

Enriquecimento do número de telefone

O Amazon Fraud Detector enriquece os dados do número de telefone com informações adicionais relacionadas à geolocalização, à operadora original e à validade do número de telefone. O enriquecimento do número de telefone é ativado automaticamente para todos os modelos treinados em ou após 13 de dezembro de 2021 e têm um número de telefone que inclui um código de país (+xxx). Se você incluiu a variável de número de telefone em seu modelo e a treinou antes de 13 de dezembro de 2021, treine novamente seu modelo para que ele possa aproveitar esse enriquecimento.

É altamente recomendável que você use o seguinte formato para variáveis de número de telefone para garantir que seus dados sejam enriquecidos com sucesso.

Variável Formato Descrição
PHONE_NUMBER O padrão E.164 Certifique-se de incluir o código do país (+xxx) com o número de telefone.
BILLING_PHONE e SHIPPING_PHONE O padrão E.164 Certifique-se de incluir o código do país (+xxx) com o número de telefone.

Enriquecimento da geolocalização

A partir de 8 de fevereiro de 2022, o Amazon Fraud Detector calcula a distância física entre os valores IP_ADDRESS, BILLING_ZIP e SHIPPING_ZIP que você fornece para um evento. As distâncias calculadas são usadas como entradas para seu modelo de detecção de fraudes.

Para habilitar o enriquecimento da geolocalização, os dados do evento devem incluir pelo menos duas das três variáveis: IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP. Além disso, cada valor BILLING_ZIP e SHIPPING_ZIP deve ter um código BILLING_COUNTRY e um código SHIPPING_COUNTRY válidos, respectivamente. Se você tem um modelo que foi treinado antes de 8 de fevereiro de 2022 e inclui essas variáveis, você deve treinar novamente o modelo para habilitar o enriquecimento da geolocalização.

Se o Amazon Fraud Detector não conseguir determinar a localização associada aos valores IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP de um evento devido à invalidade dos dados, um valor especial de espaço reservado será usado em vez disso. Por exemplo, suponha que um evento tenha valores de IP_ADDRESS e BILLING_ZIP válidos, mas o valor SHIPPING_ZIP não seja válido. Nesse caso, o enriquecimento é feito somente para IP_ADDRESS—> BILLING_ZIP. O enriquecimento não é feito para IP_ADDRESS—>SHIPPING_ZIP e BILLING_ZIP—>SHIPPING_ZIP. Em vez disso, os valores do espaço reservado são usados em seu lugar. Não importa se o enriquecimento de geolocalização está habilitado para seu modelo ou não, o desempenho do seu modelo não muda.

Você pode desativar o enriquecimento de geolocalização mapeando suas variáveis BILLING_ZIP e SHIPPING_ZIP para o tipo de variável CUSTOM_CATEGORICAL. Alterar o tipo de variável não afeta o desempenho do seu modelo.

Formato da variável de geolocalização

É altamente recomendável que você use o seguinte formato para variáveis de geolocalização para garantir que seus dados de localização sejam enriquecidos com sucesso.

Variável Formato Descrição
IP_ADDRESS Endereço IPv4 Por exemplo - 1.1.1.1
BILLING_ZIP e SHIPPING_ZIP O código postal ISO 3166-1 alfa-2 para o país especificado Para obter mais informações, consulte a seção Códigos de país e território neste tópico.
BILLING_COUNTRY e SHIPPING_COUNTRY O código de país padrão ISO 3166-1 alfa-2 de duas letras Para obter mais informações, consulte a seção Códigos de país e território neste tópico. O Amazon Fraud Detector tenta combinar todas as variações comuns do nome de um país com seu código de país padrão de duas letras ISO 3166-1. No entanto, não podemos garantir que eles serão combinados corretamente.

A tabela a seguir fornece uma lista completa dos países e territórios que são suportados pelo Amazon Fraud Detector para enriquecimento de geolocalização. Cada país e território tem um código de país atribuído (especificamente, o código de país de duas letras ISO 3166-1 alfa-2) e um código postal.

Formato de código postal

  • 9 - número

  • a - letra

  • [X] - X é opcional. Por exemplo, Guersney “GY9 [9] 9aa” significa que tanto “GY9 9aa” quanto “GY99 9aa” são válidos. Use um formato.

  • [X/XX] - X ou XX podem ser usados. Por exemplo, Bermuda “aa [aa/99]” significa que tanto “aa aa” quanto “aa 99" são válidos. Use qualquer um desses formatos, mas não os dois.

  • Alguns países têm prefixo fixo. Por exemplo, o código postal de Andorra é AD999. Isso significa que o código do país deve começar com as letras AD seguidas por três números.

Código Name (Nome) Código postal
AD Andorra AD999
AR Antilhas Holandesas 9999
AT Áustria 9999
AU Austrália 9999
AZ Azerbaijão COMO 999
CAMA Bangladesh 9999
SER Bélgica 9999
POR Bulgária 9999
BM Bermudas aa [aa/99]
BY Bielorrússia 999999
CA Canadá a9a 9a9
CH Suíça 9999
CL Chile 9999999
CO Colômbia 999999
CR Costa Rica 99999
CHORAR Chipre 9999
CZ Tchequia 99 99
DE Alemanha 99999
DK Dinamarca 9999
DO República Dominicana 99999
DZ Argélia 99999
EE Estônia 99999
ES Espanha 99999
SE Finlândia 99999
FM Estados Federados da Micronésia 99999
DE Ilhas Faroe 999
FR França 99999
GB Reino Unido [a] 9 [a/9] 9aa
GG Guernsey GY9 [9] 9aa
GL Groenlândia 9999
GP Guadalupe 99999
GT Guatemala 99999
ARMA Guam 99999
HR Croácia 99999
HU Hungria 9999
IE Irlanda a99 [a/9] [a/9] [a/9] [a/9]
EU SOU Ilha de Man IM9 [9] 9aa
IN Índia 999999
IS Islândia 999
ISSO Itália 99999
JE Jérsei JE9 [9] 9aa
JP Japão 999-9999
KR República da Coreia 99999
MENTIRA Liechtenstein 9999
LK Sri Lanka 99999
LT Lituânia 99999
LU Luxemburgo L-9999
LV Letônia LV-9999
MC Mônaco 99999
MD República da Moldávia 9999
MH Ilhas Marshall 99999
KM Macedônia do Norte 9999
MAPA Ilhas Marianas do Norte 99999
MQ Matinique 99999
MT Malta aaaa 999
MX México 99999
MEU Malásia 99999
NL Holanda 999 aa
NO Noruega 9999
NZ Nova Zelândia 9999
PH Filipinas 9999
PK Paquistão 99999
PL Polônia 99-999
PR Porto Rico 99999
PT Portugal 9999-999
PW Palau 99999
SOBRE

Reunião

99999
OU Romênia 999999
RU Federação Russa 999999
SE Suécia 99 99
SG Singapura 999999
É Eslovênia 9999
SK Eslováquia 99 99
SM São Marinho 99999
TH Tailândia 99999
TR Turquia 99999
UA Ucrânia 99999
EUA Estados Unidos 99999
COMPRAR Uruguai 99999
VI Ilhas Virgens Americanas 99999
WF Wallis e Futuna 99999
AINDA Mayotte 99999
ZA África do Sul 9999

Enriquecimento do agente do usuário

Se você criar o modelo Account Takeover Insights (ATI), deverá fornecer uma variável do tipo de useragent variável em seu conjunto de dados. Essa variável contém os dados do navegador, dispositivo e sistema operacional de um evento de login. O Amazon Fraud Detector enriquece os dados do agente do usuário com informações adicionais, como e. user_agent_family OS_family device_family