Tipos de dados Valor padrão Tipos de variáveis Enriquecimentos variáveis

Variáveis

As variáveis representam elementos de dados que você deseja usar em uma previsão de fraude. Essas variáveis podem ser obtidas do conjunto de dados do evento que você preparou para treinar seu modelo, dos resultados da pontuação de risco do seu modelo do Amazon Fraud Detector ou dos modelos da Amazon. SageMaker Para obter mais informações sobre variáveis retiradas do conjunto de dados do evento, consulteObtenha os requisitos do conjunto de dados de eventos usando o Data Models Explorer.

As variáveis que você deseja usar em sua previsão de fraude devem primeiro ser criadas e depois adicionadas ao evento ao criar seu tipo de evento. Cada variável criada deve receber um tipo de dados, um valor padrão e, opcionalmente, um tipo de variável. O Amazon Fraud Detector enriquece algumas das variáveis que você fornece, como endereços IP, números de identificação bancária (BINs) e números de telefone, para criar entradas adicionais e aumentar o desempenho dos modelos que usam essas variáveis.

Tipos de dados

As variáveis devem ter um tipo de dados para o elemento de dados que a variável representa e, opcionalmente, podem ser atribuídos a um dos predefinidosTipos de variáveis. Para variáveis atribuídas a um tipo de variável, o tipo de dados é pré-selecionado. Os tipos de dados possíveis incluem os seguintes tipos:

Tipo de dados	Descrição	Valor padrão	Exemplos de valores
String	Qualquer combinação de letras, números inteiros ou ambos	<empty>	abc, 123, 13DB
Inteiro	Números inteiros positivos ou negativos	0	1, -1
Booliano	Verdadeiro ou falso	Falso	Verdadeiro, falso
DateTime	Data e hora especificadas somente no formato UTC padrão ISO 8601	<empty>	30/11/2019 ÀS 13:01:01 Z
Float	Números com pontos decimais	0.0	4,01, 0,10

Valor padrão

As variáveis devem ter um valor padrão. Quando o Amazon Fraud Detector gera previsões de fraude, esse valor padrão é usado para executar uma regra ou modelo se o Amazon Fraud Detector não receber um valor para uma variável. Os valores padrão fornecidos devem corresponder ao tipo de dados selecionado. No console da AWS, o Amazon Fraud Detector atribui o valor padrão de 0 para números inteiros, para booleanos, false para flutuadores e (vazio) 0.0 para cadeias de caracteres. Você pode definir um valor padrão personalizado para qualquer um desses tipos de dados.

Tipos de variáveis

Ao criar uma variável, você pode, opcionalmente, atribuir a variável a um tipo de variável. O tipo de variável representa os elementos de dados comuns usados para treinar modelos e gerar previsões de fraude. Somente variáveis com um tipo de variável associado podem ser usadas para o treinamento do modelo. Como parte do processo de treinamento do modelo, o Amazon Fraud Detector usa o tipo de variável associado à variável para realizar enriquecimentos variáveis, engenharia de recursos e pontuação de risco.

O Amazon Fraud Detector predefiniu os seguintes tipos de variáveis que podem ser usados para atribuir às suas variáveis.

Categoria	Tipo de variável	Descrição	Tipo de dados	Exemplo
Sessão	IP_ADDRESS	O endereço IP que é coletado durante o evento	String	192.0.2.0 Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento da geolocalização.
	AGENTE DE USUÁRIO	O agente de usuário que é coletado durante o evento	String	Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv: 68.0) Gecko 20100101
	IMPRESSÃO DIGITAL	O identificador exclusivo de um dispositivo usado para o evento	String	sadfow987u234
	SESSION_ID	O ID da sessão ativa do evento	String	sid123456789
	SÃO_CREDENTIALS_VÁLIDAS	Indica se as credenciais usadas para o login do evento são válidas	Booliano	Verdadeiro
Usuário	ENDEREÇO DE E-MAIL	O endereço de e-mail coletado durante o evento	String	abc@domain.com
Usuário	PHONE_NUMBER	O número de telefone coletado durante o evento	String	+1 555-0100 Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone.
Faturamento	NOME_DO_FATURAMENTO	O nome associado ao endereço de cobrança	String	John Doe
	TELEFONE DE COBRANÇA	O número de telefone associado ao endereço de cobrança	String	+1 555-0100 Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone.
	ENDEREÇO_DE_FATURAMENTO_L1	A primeira linha do endereço de cobrança	String	Qualquer rua
	ENDEREÇO_DE_FATURAMENTO_L2	A segunda linha do endereço de cobrança	String	Qualquer unidade 123
	CIDADE DE COBRANÇA	A cidade que está no endereço de cobrança	String	Qualquer cidade
	ESTADO DE COBRANÇA	O estado ou província que está no endereço de cobrança	String	Qualquer estado ou província
	PAÍS_DE_FATURAMENTO	O país que está no endereço de cobrança	String	Qualquer país Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento da geolocalização.
	COBRANÇA_ZIP	O código postal que está no endereço de cobrança	String	01234 Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento da geolocalização.
Remessa	NOME_DE_ENVIO	O nome associado ao endereço de entrega	String	John Doe
	TELEFONE_DE_ENVIO	O número de telefone associado ao endereço de entrega	String	+1 555-0100 Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone.
	ENDEREÇO_DE_FRETE_L1	A primeira linha do endereço de entrega	String	123 Any Street
	ENDEREÇO_DE_ENVIO_L2	A segunda linha do endereço de entrega	String	Unidade 123
	CIDADE_EXPEDIÇÃO	A cidade que está no endereço de entrega	String	Qualquer cidade
	ESTADO_DE_ENVIO	O estado ou província que está no endereço de entrega	String	Qualquer estado
	PAÍS_DE_ENVIO	O país que está no endereço de entrega	String	Qualquer país Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento da geolocalização.
	SHIPPING_ZIP	O código postal que está no endereço de entrega	String	01234 Nota: O Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento da geolocalização.
Pagamento	ID_DO PEDIDO	O identificador exclusivo da transação	String	LUX60
	PREÇO	O preço total do pedido	String	560,00
	CÓDIGO_DA_MOEDA	O código de moeda ISO 4217	String	USD
	TIPO_DE_PAGAMENTO	A forma de pagamento usada para pagamento durante o evento	String	Cartão de crédito
	CÓDIGO_FONTE	O código alfanumérico enviado por um emissor de cartão de crédito ou banco emissor	String	0000
	AVS	O código de resposta do sistema de verificação de endereço (AVS) do processador do cartão	String	Y
Produto	CATEGORIA_PRODUTO	A categoria de produto do item do pedido	String	Cozinha
Personalizar	NUMERIC	Qualquer variável que possa ser representada como um número real	Float	1.224
	CATEGORICAL	Qualquer variável que descreva categorias, segmentos ou grupos	String	Grande
	TEXTO_EM FORMATO LIVRE	Qualquer texto de formato livre que seja capturado como parte do evento (por exemplo, uma avaliação ou comentário de um cliente)	String	Exemplo de entrada de texto em formato livre

Atribuindo variável a um tipo de variável

Se você planeja usar uma variável para treinar seu modelo, é importante escolher um tipo de variável correto para atribuir à variável. A atribuição incorreta do tipo de variável pode afetar negativamente o desempenho do seu modelo. Também pode ser muito difícil alterar a atribuição posteriormente, especialmente se vários modelos e eventos tiverem usado a variável.

Você pode atribuir à sua variável qualquer um dos tipos de variáveis predefinidos ou um dos tipos de variáveis personalizadas —FREE_FORM_TEXT,CATEGORICAL, ou. NUMERIC

Notas importantes para atribuir variáveis aos tipos de variáveis corretos

Se a variável corresponder a um dos tipos de variáveis predefinidos, use-a. Certifique-se de que o tipo de variável corresponda à variável. Por exemplo, se você atribuir uma variável ip_address ao tipo de variável, a EMAIL_ADDRESS variável ip_address não será enriquecida com enriquecimentos como ASN, ISP, localização geográfica e pontuação de risco. Para obter mais informações, consulte Enriquecimentos variáveis.
Se a variável não corresponder a nenhum dos tipos de variáveis predefinidos, siga as recomendações listadas abaixo para atribuir um dos tipos de variáveis personalizadas.
Atribua o tipo de CATEGORICAL variável a variáveis que normalmente não têm ordem natural e podem ser colocadas em categorias, segmentos ou grupos. O conjunto de dados que você está usando para treinar seu modelo pode ter variáveis de ID como merchant_id, campaign_id ou policy_id. Essas variáveis representam grupos (por exemplo, todos os clientes com o mesmo policy_id representam um grupo). As variáveis que têm os seguintes dados devem ser atribuídas ao tipo de variável CATEGÓRICA -
- Variáveis que contêm dados como Customer_ID, Segment_ID, Color_ID, department_code ou Product_ID.
- Variáveis que contêm dados booleanos com valores verdadeiros, falsos ou nulos.
- Variáveis que podem ser colocadas em grupos ou categorias, como nome da empresa, categoria do produto, tipo de cartão ou meio de referência.
nota
ENTITY_IDé um tipo de variável reservada usado pelo Amazon Fraud Detector para atribuir à variável ENTITY_ID. A variável ENTITY_ID é a ID da entidade que está iniciando a ação que você deseja avaliar. Se você estiver criando um tipo de modelo Transaction Fraud Insight (TFI), precisará fornecer a variável ENTITY_ID. Você precisará decidir qual variável em seus dados identifica de forma exclusiva a entidade que está iniciando a ação e passá-la como variável ENTITY_ID. Atribua o tipo de variável CATEGÓRICA a todos os outros IDs em seu conjunto de dados, se eles estiverem presentes e se você os estiver usando para treinamento de modelos. Exemplos de outras IDs que não são uma entidade em seu conjunto de dados podem ser Merchant_ID, Policy_ID e Campaign_ID.
Atribua o tipo de FREE_FORM_TEXT variável às variáveis que contêm um bloco de texto. Exemplos de tipos de variáveis FREE_FORM_TEXT são: avaliações de usuários, comentários, datas e códigos de referência. Os dados FREE_FORM_TEXT contêm vários tokens separados por um delimitador. Os delimitadores podem ser qualquer caractere diferente do símbolo alfanumérico e sublinhado. Por exemplo, avaliações e comentários de usuários podem ser separados por um delimitador de “espaço”, datas e códigos de referência podem usar hífens como delimitadores para separar prefixo, sufixo e partes intermediárias. O Amazon Fraud Detector usa os delimitadores para extrair dados das variáveis FREE_FORM_TEXT.
Atribua o tipo de variável NUMERIC a variáveis que são números reais e têm ordenação inerente. Exemplos de variáveis NUMÉRICAS incluem day_of_the_week, incident_severity, customer_rating. Embora você possa atribuir o tipo de variável CATEGÓRICA a essas variáveis, é altamente recomendável atribuir todas as variáveis de número real com ordem inerente ao tipo de variável NUMERIC.

Enriquecimentos variáveis

O Amazon Fraud Detector enriquece alguns dos elementos de dados brutos que você fornece, como endereços IP, números de identificação bancária (BINs) e números de telefone, para criar entradas adicionais e aumentar o desempenho dos modelos que usam esses elementos de dados. O enriquecimento ajuda a identificar situações potencialmente suspeitas e ajuda os modelos a capturar mais fraudes.

Enriquecimento do número de telefone

O Amazon Fraud Detector enriquece os dados do número de telefone com informações adicionais relacionadas à geolocalização, à operadora original e à validade do número de telefone. O enriquecimento do número de telefone é ativado automaticamente para todos os modelos treinados em ou após 13 de dezembro de 2021 e têm um número de telefone que inclui um código de país (+xxx). Se você incluiu a variável de número de telefone em seu modelo e a treinou antes de 13 de dezembro de 2021, treine novamente seu modelo para que ele possa aproveitar esse enriquecimento.

É altamente recomendável que você use o seguinte formato para variáveis de número de telefone para garantir que seus dados sejam enriquecidos com sucesso.

Variável	Formato	Descrição
PHONE_NUMBER	O padrão E.164	Certifique-se de incluir o código do país (+xxx) com o número de telefone.
BILLING_PHONE e SHIPPING_PHONE	O padrão E.164	Certifique-se de incluir o código do país (+xxx) com o número de telefone.

Enriquecimento da geolocalização

A partir de 8 de fevereiro de 2022, o Amazon Fraud Detector calcula a distância física entre os valores IP_ADDRESS, BILLING_ZIP e SHIPPING_ZIP que você fornece para um evento. As distâncias calculadas são usadas como entradas para seu modelo de detecção de fraudes.

Para habilitar o enriquecimento da geolocalização, os dados do evento devem incluir pelo menos duas das três variáveis: IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP. Além disso, cada valor BILLING_ZIP e SHIPPING_ZIP deve ter um código BILLING_COUNTRY e um código SHIPPING_COUNTRY válidos, respectivamente. Se você tem um modelo que foi treinado antes de 8 de fevereiro de 2022 e inclui essas variáveis, você deve treinar novamente o modelo para habilitar o enriquecimento da geolocalização.

Se o Amazon Fraud Detector não conseguir determinar a localização associada aos valores IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP de um evento devido à invalidade dos dados, um valor especial de espaço reservado será usado em vez disso. Por exemplo, suponha que um evento tenha valores de IP_ADDRESS e BILLING_ZIP válidos, mas o valor SHIPPING_ZIP não seja válido. Nesse caso, o enriquecimento é feito somente para IP_ADDRESS—> BILLING_ZIP. O enriquecimento não é feito para IP_ADDRESS—>SHIPPING_ZIP e BILLING_ZIP—>SHIPPING_ZIP. Em vez disso, os valores do espaço reservado são usados em seu lugar. Não importa se o enriquecimento de geolocalização está habilitado para seu modelo ou não, o desempenho do seu modelo não muda.

Você pode desativar o enriquecimento de geolocalização mapeando suas variáveis BILLING_ZIP e SHIPPING_ZIP para o tipo de variável CUSTOM_CATEGORICAL. Alterar o tipo de variável não afeta o desempenho do seu modelo.

Formato da variável de geolocalização

É altamente recomendável que você use o seguinte formato para variáveis de geolocalização para garantir que seus dados de localização sejam enriquecidos com sucesso.

Variável	Formato	Descrição
IP_ADDRESS	Endereço IPv4	Por exemplo - 1.1.1.1
BILLING_ZIP e SHIPPING_ZIP	O código postal ISO 3166-1 alfa-2 para o país especificado	Para obter mais informações, consulte a seção Códigos de país e território neste tópico.
BILLING_COUNTRY e SHIPPING_COUNTRY	O código de país padrão ISO 3166-1 alfa-2 de duas letras	Para obter mais informações, consulte a seção Códigos de país e território neste tópico. O Amazon Fraud Detector tenta combinar todas as variações comuns do nome de um país com seu código de país padrão de duas letras ISO 3166-1. No entanto, não podemos garantir que eles serão combinados corretamente.

A tabela a seguir fornece uma lista completa dos países e territórios que são suportados pelo Amazon Fraud Detector para enriquecimento de geolocalização. Cada país e território tem um código de país atribuído (especificamente, o código de país de duas letras ISO 3166-1 alfa-2) e um código postal.

Formato de código postal

9 - número
a - letra
[X] - X é opcional. Por exemplo, Guersney “GY9 [9] 9aa” significa que tanto “GY9 9aa” quanto “GY99 9aa” são válidos. Use um formato.
[X/XX] - X ou XX podem ser usados. Por exemplo, Bermuda “aa [aa/99]” significa que tanto “aa aa” quanto “aa 99" são válidos. Use qualquer um desses formatos, mas não os dois.
Alguns países têm prefixo fixo. Por exemplo, o código postal de Andorra é AD999. Isso significa que o código do país deve começar com as letras AD seguidas por três números.

Código	Name (Nome)	Código postal
AD	Andorra	AD999
AR	Antilhas Holandesas	9999
AT	Áustria	9999
AU	Austrália	9999
AZ	Azerbaijão	COMO 999
CAMA	Bangladesh	9999
SER	Bélgica	9999
POR	Bulgária	9999
BM	Bermudas	aa [aa/99]
BY	Bielorrússia	999999
CA	Canadá	a9a 9a9
CH	Suíça	9999
CL	Chile	9999999
CO	Colômbia	999999
CR	Costa Rica	99999
CHORAR	Chipre	9999
CZ	Tchequia	99 99
DE	Alemanha	99999
DK	Dinamarca	9999
DO	República Dominicana	99999
DZ	Argélia	99999
EE	Estônia	99999
ES	Espanha	99999
SE	Finlândia	99999
FM	Estados Federados da Micronésia	99999
DE	Ilhas Faroe	999
FR	França	99999
GB	Reino Unido	[a] 9 [a/9] 9aa
GG	Guernsey	GY9 [9] 9aa
GL	Groenlândia	9999
GP	Guadalupe	99999
GT	Guatemala	99999
ARMA	Guam	99999
HR	Croácia	99999
HU	Hungria	9999
IE	Irlanda	a99 [a/9] [a/9] [a/9] [a/9]
EU SOU	Ilha de Man	IM9 [9] 9aa
IN	Índia	999999
IS	Islândia	999
ISSO	Itália	99999
JE	Jérsei	JE9 [9] 9aa
JP	Japão	999-9999
KR	República da Coreia	99999
MENTIRA	Liechtenstein	9999
LK	Sri Lanka	99999
LT	Lituânia	99999
LU	Luxemburgo	L-9999
LV	Letônia	LV-9999
MC	Mônaco	99999
MD	República da Moldávia	9999
MH	Ilhas Marshall	99999
KM	Macedônia do Norte	9999
MAPA	Ilhas Marianas do Norte	99999
MQ	Matinique	99999
MT	Malta	aaaa 999
MX	México	99999
MEU	Malásia	99999
NL	Holanda	999 aa
NO	Noruega	9999
NZ	Nova Zelândia	9999
PH	Filipinas	9999
PK	Paquistão	99999
PL	Polônia	99-999
PR	Porto Rico	99999
PT	Portugal	9999-999
PW	Palau	99999
SOBRE	Reunião	99999
OU	Romênia	999999
RU	Federação Russa	999999
SE	Suécia	99 99
SG	Singapura	999999
É	Eslovênia	9999
SK	Eslováquia	99 99
SM	São Marinho	99999
TH	Tailândia	99999
TR	Turquia	99999
UA	Ucrânia	99999
EUA	Estados Unidos	99999
COMPRAR	Uruguai	99999
VI	Ilhas Virgens Americanas	99999
WF	Wallis e Futuna	99999
AINDA	Mayotte	99999
ZA	África do Sul	9999

Enriquecimento do agente do usuário

Se você criar o modelo Account Takeover Insights (ATI), deverá fornecer uma variável do tipo de useragent variável em seu conjunto de dados. Essa variável contém os dados do navegador, dispositivo e sistema operacional de um evento de login. O Amazon Fraud Detector enriquece os dados do agente do usuário com informações adicionais, como e. user_agent_family OS_family device_family

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Recursos

Crie uma variável