Seleção da fonte de dados Preparar dados Seleção de dados Validando dados

Insights sobre aquisição de contas

O tipo de modelo Account Takeover Insights (ATI) identifica atividades on-line fraudulentas detectando se as contas foram comprometidas por invasões maliciosas, phishing ou roubo de credenciais. O Account Takeover Insights é um modelo de aprendizado de máquina que usa eventos de login da sua empresa on-line para treinar o modelo.

Você pode incorporar um modelo treinado do Account Takeover Insights ao seu fluxo de login em tempo real para detectar se uma conta está comprometida. O modelo avalia uma variedade de tipos de autenticação e login. Eles incluem logins de aplicativos web, autenticações baseadas em API e single-sign-on (SSO). Para usar o modelo Account Takeover Insights, chame a GetEventPredictionAPI depois que uma credencial de login válida for apresentada. A API gera uma pontuação que quantifica o risco de a conta ser comprometida. O Amazon Fraud Detector usa a pontuação e as regras que você definiu para retornar um ou mais resultados para os eventos de login. Os resultados são aqueles que você configurou. Com base nos resultados que você recebe, você pode tomar as medidas apropriadas para cada login. Ou seja, você pode aprovar ou contestar as credenciais apresentadas para o login. Por exemplo, você pode contestar as credenciais solicitando um PIN da conta como verificação adicional.

Você também pode usar o modelo Account Takeover Insights para avaliar logins de contas de forma assíncrona e realizar ações em contas de alto risco. Por exemplo, uma conta de alto risco pode ser adicionada à fila de investigação para que um revisor humano determine se outras medidas precisam ser tomadas, como suspender a conta.

O modelo Account Takeover Insights é treinado usando um conjunto de dados que contém os eventos históricos de login da sua empresa. Você fornece esses dados. Opcionalmente, você pode rotular as contas como legítimas ou fraudulentas. No entanto, isso não é necessário para treinar o modelo. O modelo Account Takeover Insights detecta anomalias com base no histórico de logins bem-sucedidos de uma conta. Ele também aprende a detectar anomalias no comportamento de um usuário que sugerem um risco maior de um evento de invasão maliciosa da conta. Por exemplo, um usuário que normalmente faz login a partir do mesmo conjunto de dispositivos e endereços IP. Um fraudador normalmente faz login usando um dispositivo e uma localização geográfica diferentes. Essa técnica produz uma pontuação de risco de uma atividade ser anômala, o que normalmente é a principal característica das invasões de contas mal-intencionadas.

Antes de treinar um modelo do Account Takeover Insights, o Amazon Fraud Detector usa uma combinação de técnicas de aprendizado de máquina para realizar o enriquecimento, a agregação e a transformação de dados. Então, durante o processo de treinamento, o Amazon Fraud Detector enriquece os elementos de dados brutos que você fornece. Exemplos de elementos de dados brutos incluem endereço IP e agente de usuário. O Amazon Fraud Detector usa esses elementos para criar entradas adicionais que descrevem os dados de login. Essas entradas incluem o dispositivo, o navegador e as entradas de geolocalização. O Amazon Fraud Detector também usa os dados de login que você fornece para computar continuamente variáveis agregadas que descrevem o comportamento anterior do usuário. Exemplos de comportamento do usuário incluem o número de vezes que o usuário fez login a partir de um endereço IP específico. Usando esses enriquecimentos e agregados adicionais, o Amazon Fraud Detector pode gerar um forte desempenho do modelo a partir de um pequeno conjunto de entradas de seus eventos de login.

O modelo Account Takeover Insights detecta casos em que uma conta legítima é acessada por um agente mal-intencionado, independentemente de o agente mal-intencionado ser humano ou robô. O modelo produz uma pontuação única que indica o risco relativo de comprometimento da conta. As contas que podem ter sido comprometidas são marcadas como contas de alto risco. Você pode processar contas de alto risco de duas maneiras. Você também pode impor uma verificação de identidade adicional. Ou você pode enviar a conta para uma fila para investigação manual.

Seleção da fonte de dados

Os modelos do Account Takeover Insights são treinados em um conjunto de dados armazenado internamente, no Amazon Fraud Detector. Para armazenar seus dados de eventos de login com o Amazon Fraud Detector, crie um arquivo CSV com os eventos de login dos usuários. Para cada evento, inclua dados de login, como data e hora do evento, ID do usuário, endereço IP, agente do usuário e se os dados de login são válidos. Depois de criar o arquivo CSV, primeiro faça o upload do arquivo para o Amazon Fraud Detector e, em seguida, use o recurso de importação para armazenar os dados. Em seguida, você pode treinar seu modelo usando os dados armazenados. Para obter mais informações sobre como armazenar seu conjunto de dados de eventos com o Amazon Fraud Detector, consulte Armazene seus dados de eventos internamente com o Amazon Fraud Detector

Preparar dados

O Amazon Fraud Detector exige que você forneça os dados de login da sua conta de usuário em um arquivo de valores separados por vírgula (CSV) codificado no formato UTF-8. A primeira linha do seu arquivo CSV deve conter um cabeçalho de arquivo. O cabeçalho do arquivo consiste em metadados de eventos e variáveis de eventos que descrevem cada elemento de dados. Os dados do evento seguem o cabeçalho. Cada linha nos dados do evento consiste em dados de um único evento de login.

Para o modelo Accounts Takeover Insights, você deve fornecer os seguintes metadados de eventos e variáveis de eventos na linha de cabeçalho do seu arquivo CSV.

Metadados do evento

Recomendamos que você forneça os seguintes metadados no cabeçalho do arquivo CSV. Os metadados do evento devem estar em letras maiúsculas.

EVENT_ID - Um identificador exclusivo para o evento de login.
ENTITY_TYPE - A entidade que realiza o evento de login, como um lojista ou um cliente.
ENTITY_ID - Um identificador para a entidade que está executando o evento de login.
EVENT_TIMESTAMP - A data e hora em que o evento de login ocorreu. O carimbo de data/hora deve estar no padrão ISO 8601 em UTC.
EVENT_LABEL (recomendado) - Um rótulo que classifica o evento como fraudulento ou legítimo. Você pode usar qualquer rótulo, como “fraude”, “legítimo”, “1" ou “0".

nota

Os metadados do evento devem estar em letras maiúsculas. É sensível a maiúsculas e minúsculas.
Os rótulos não são necessários para eventos de login. No entanto, recomendamos que você inclua os metadados EVENT_LABEL e forneça rótulos para seus eventos de login. Tudo bem se os rótulos estiverem incompletos ou esporádicos. Se você fornecer etiquetas, o Amazon Fraud Detector as usará para calcular automaticamente uma taxa de descoberta de aquisição de contas e exibi-la no gráfico e na tabela de desempenho do modelo.

Variáveis do evento

Para o modelo Accounts Takeover Insights, há variáveis obrigatórias (obrigatórias) que você deve fornecer e variáveis opcionais. Ao criar suas variáveis, certifique-se de atribuir a variável ao tipo correto de variável. Como parte do processo de treinamento do modelo, o Amazon Fraud Detector usa o tipo de variável associado à variável para realizar o enriquecimento de variáveis e a engenharia de recursos.

nota

Os nomes das variáveis do evento devem estar em letras minúsculas. Eles diferenciam maiúsculas de minúsculas.

Variáveis obrigatórias

As variáveis a seguir são necessárias para treinar um modelo do Accounts Takeover Insights.

Categoria	Tipo de variável	Descrição
Endereço IP	IP_ADDRESS	O endereço IP usado no evento de login
Navegador e dispositivo	AGENTE DE USUÁRIO	O navegador, o dispositivo e o sistema operacional usados no evento de login
Credenciais válidas	CREDENCIADO VÁLIDO	Indica se as credenciais usadas para login são válidas

Variáveis opcionais

As variáveis a seguir são opcionais para treinar um modelo do Accounts Takeover Insights.

Categoria	Tipo	Descrição
Navegador e dispositivo	IMPRESSÃO DIGITAL	O identificador exclusivo da impressão digital de um navegador ou dispositivo
ID da sessão	SESSION_ID	O identificador de uma sessão de autenticação
Rótulo	RÓTULO_EVENTO	Uma etiqueta que classifica o evento como fraudulento ou legítimo. Você pode usar qualquer rótulo, como “fraude”, “legítimo”, “1" ou “0".
Timestamp	LABEL_TIMESTAMP	O carimbo de data e hora da última atualização do rótulo. Isso é necessário se EVENT_LABEL for fornecido.

nota

Você pode fornecer qualquer nome de variável para ambas as variáveis obrigatórias (variáveis opcionais). É importante que cada variável obrigatória e opcional seja atribuída ao tipo correto de variável.
Você pode fornecer variáveis adicionais. No entanto, o Amazon Fraud Detector não incluirá essas variáveis para treinar um modelo do Accounts Takeover Insights.

Seleção de dados

A coleta de dados é uma etapa importante para criar seu modelo Account Takeover Insights. Ao começar a coletar seus dados de login, considere os seguintes requisitos e recomendações:

Obrigatório

Forneça pelo menos 1.500 exemplos de contas de usuário, cada uma com pelo menos dois eventos de login associados.
Seu conjunto de dados deve abranger pelo menos 30 dias de eventos de login. Posteriormente, você pode especificar o intervalo de tempo específico dos eventos a serem usados para treinar o modelo.

Recomendado

Seu conjunto de dados inclui exemplos de eventos de login malsucedidos. Opcionalmente, você pode rotular esses logins malsucedidos como “fraudulentos” ou “legítimos”.
Prepare dados históricos com eventos de login que abrangem mais de seis meses e inclua 100 mil entidades.

Se você não tiver um conjunto de dados que já atenda aos requisitos mínimos, considere transmitir dados de eventos para o Amazon Fraud Detector chamando a operação da SendEventAPI.

Validando dados

Antes de criar seu modelo Account Takeover Insights, o Amazon Fraud Detector verifica se os metadados e as variáveis que você incluiu em seu conjunto de dados para treinar o modelo atendem aos requisitos de tamanho e formato. Para obter mais informações, consulte Validação do conjunto de dados. Ele também verifica outros requisitos. Se o conjunto de dados não passar pela validação, o modelo não será criado. Para que o modelo seja criado com sucesso, certifique-se de corrigir os dados que não passaram na validação antes de treinar novamente.

Erros comuns do conjunto de dados

Ao validar um conjunto de dados para treinar um modelo do Account Takeover Insights, o Amazon Fraud Detector verifica esses e outros problemas e gera um erro se encontrar um ou mais dos problemas.

O arquivo CSV não está no formato UTF-8.
O cabeçalho do arquivo CSV não contém pelo menos um dos seguintes metadados:EVENT_ID,ENTITY_ID, ou. EVENT_TIMESTAMP
O cabeçalho do arquivo CSV não contém pelo menos uma variável dos seguintes tipos de variáveis:IP_ADDRESS,USERAGENT, ouVALIDCRED.
Há mais de uma variável associada ao mesmo tipo de variável.
Mais de 0,1% dos valores em EVENT_TIMESTAMP contêm valores nulos ou valores diferentes dos formatos de data e hora suportados.
O número de dias entre o primeiro e o último evento é inferior a 30 dias.
Mais de 10% das variáveis do tipo IP_ADDRESS variável são inválidas ou nulas.
Mais de 50% das variáveis do tipo USERAGENT variável contêm nulos.
Todas as variáveis do tipo de VALIDCRED variável são definidas comofalse.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Informações sobre fraudes em transações

Criar um modelo