Información sobre la apropiación de cuentas - Amazon Fraud Detector

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Información sobre la apropiación de cuentas

El tipo de modelo Account Takeover Insights (ATI) identifica la actividad fraudulenta en línea al detectar si las cuentas se vieron comprometidas por apropiaciones malintencionadas, suplantación de identidad o por el robo de credenciales. Account Takeover Insights es un modelo de aprendizaje automático que utiliza los eventos de inicio de sesión de su negocio en línea para entrenar el modelo.

Puedes integrar un modelo especializado de Account Takeover Insights en tu flujo de inicio de sesión en tiempo real para detectar si una cuenta está comprometida. El modelo evalúa una variedad de tipos de autenticación e inicio de sesión. Incluyen los inicios de sesión en aplicaciones web, las autenticaciones basadas en API y single-sign-on (SSO). Para usar el modelo Account Takeover Insights, llama a la GetEventPredictionAPI después de presentar unas credenciales de inicio de sesión válidas. La API genera una puntuación que cuantifica el riesgo de que la cuenta se vea comprometida. Amazon Fraud Detector utiliza la puntuación y las reglas que usted definió para obtener uno o más resultados de los eventos de inicio de sesión. Los resultados son los que usted configuró. En función de los resultados que reciba, podrá tomar las medidas adecuadas para cada inicio de sesión. Es decir, puede aprobar o impugnar las credenciales presentadas para el inicio de sesión. Por ejemplo, puede cuestionar las credenciales solicitando el PIN de la cuenta como verificación adicional.

También puedes usar el modelo Account Takeover Insights para evaluar los inicios de sesión de las cuentas de forma asíncrona y tomar medidas en las cuentas de alto riesgo. Por ejemplo, se puede añadir una cuenta de alto riesgo a la cola de investigación para que un revisor humano determine si es necesario tomar medidas adicionales, como suspender la cuenta.

El modelo Account Takeover Insights se ha diseñado con un conjunto de datos que contiene el historial de inicios de sesión de su empresa. Usted proporciona estos datos. Si lo desea, puede etiquetar las cuentas como legítimas o fraudulentas. Sin embargo, esto no es necesario para entrenar el modelo. El modelo Account Takeover Insights detecta las anomalías en función del historial de inicios de sesión satisfactorios de una cuenta. También aprende a detectar anomalías en el comportamiento de un usuario que sugieran un mayor riesgo de que se produzca un robo malintencionado de una cuenta. Por ejemplo, un usuario que normalmente inicia sesión desde el mismo conjunto de dispositivos y direcciones IP. Por lo general, un defraudador inicia sesión desde un dispositivo y una ubicación geográfica diferentes. Esta técnica genera una puntuación de riesgo de que una actividad sea anómala, lo que suele ser una de las principales características de las apropiaciones malintencionadas de cuentas.

Antes de entrenar un modelo de Account Takeover Insights, Amazon Fraud Detector utiliza una combinación de técnicas de aprendizaje automático para enriquecer, agregar y transformar datos. Luego, durante el proceso de formación, Amazon Fraud Detector enriquece los elementos de datos sin procesar que usted proporciona. Algunos ejemplos de elementos de datos sin procesar incluyen la dirección IP y el agente de usuario. Amazon Fraud Detector utiliza estos elementos para crear entradas adicionales que describen los datos de inicio de sesión. Estas entradas incluyen las entradas del dispositivo, el navegador y la geolocalización. Amazon Fraud Detector también utiliza los datos de inicio de sesión que usted proporciona para calcular continuamente variables agregadas que describen el comportamiento de los usuarios en el pasado. Algunos ejemplos del comportamiento de los usuarios incluyen el número de veces que el usuario ha iniciado sesión desde una dirección IP específica. Con estas mejoras y agregados adicionales, Amazon Fraud Detector puede generar un sólido rendimiento del modelo a partir de un pequeño conjunto de entradas de sus eventos de inicio de sesión.

El modelo Account Takeover Insights detecta los casos en los que un infractor accede a una cuenta legítima, independientemente de si el infractor es humano o un robot. El modelo genera una puntuación única que indica el riesgo relativo de comprometer la cuenta. Las cuentas que podrían haberse visto comprometidas se marcan como cuentas de alto riesgo. Puedes procesar las cuentas de alto riesgo de dos maneras. O bien, puedes exigir una verificación de identidad adicional. O bien, puedes enviar la cuenta a una lista de espera para que la investiguen manualmente.

Selección de la fuente de datos

Los modelos de Account Takeover Insights se basan en un conjunto de datos que se almacena internamente en Amazon Fraud Detector. Para almacenar los datos de sus eventos de inicio de sesión con Amazon Fraud Detector, cree un archivo CSV con los eventos de inicio de sesión de los usuarios. Para cada evento, incluya los datos de inicio de sesión, como la marca de tiempo del evento, el ID de usuario, la dirección IP, el agente de usuario y si los datos de inicio de sesión son válidos. Tras crear el archivo CSV, súbelo primero a Amazon Fraud Detector y, a continuación, utilice la función de importación para almacenar los datos. A continuación, puede entrenar su modelo con los datos almacenados. Para obtener más información sobre cómo almacenar tu conjunto de datos de eventos con Amazon Fraud Detector, consulta Almacene los datos de sus eventos internamente con Amazon Fraud Detector

Preparación de datos

Amazon Fraud Detector requiere que proporciones los datos de inicio de sesión de tu cuenta de usuario en un archivo de valores separados por comas (CSV) codificado en formato UTF-8. La primera línea del archivo CSV debe contener un encabezado de archivo. El encabezado del archivo consta de metadatos de eventos y variables de eventos que describen cada elemento de datos. Los datos del evento siguen al encabezado. Cada línea de los datos del evento consta de datos de un solo evento de inicio de sesión.

Para el modelo Accounts Takeover Insights, debes proporcionar los siguientes metadatos y variables de eventos en la línea de encabezado de tu archivo CSV.

Metadatos del evento

Te recomendamos que introduzcas los siguientes metadatos en el encabezado del archivo CSV. Los metadatos del evento deben estar en mayúsculas.

  • EVENT_ID: identificador único para el evento de inicio de sesión.

  • ENTITY_TYPE: la entidad que realiza el evento de inicio de sesión, como un comerciante o un cliente.

  • ENTITY_ID: identificador de la entidad que realiza el evento de inicio de sesión.

  • EVENT_TIMESTAMP: la marca de tiempo en que se produjo el evento de inicio de sesión. La marca de tiempo debe estar en la norma ISO 8601 en UTC.

  • EVENT_LABEL (recomendado): etiqueta que clasifica el evento como fraudulento o legítimo. Puedes usar cualquier etiqueta, como «fraude», «legítimo», «1» o «0".

nota
  • Los metadatos del evento deben estar en mayúsculas. Distingue entre mayúsculas y minúsculas.

  • No se requieren etiquetas para los eventos de inicio de sesión. Sin embargo, te recomendamos que incluyas los metadatos de EVENT_LABEL y proporciones etiquetas para tus eventos de inicio de sesión. No hay problema si las etiquetas están incompletas o son esporádicas. Si facilitas etiquetas, Amazon Fraud Detector las utilizará para calcular automáticamente la tasa de robo de cuentas descubiertas y la mostrará en el gráfico y la tabla de rendimiento del modelo.

Variables de eventos

Para el modelo Accounts Takeover Insights, hay variables obligatorias (obligatorias) que debe proporcionar y variables opcionales. Al crear las variables, asegúrese de asignarlas al tipo de variable correcto. Como parte del proceso de formación del modelo, Amazon Fraud Detector utiliza el tipo de variable asociado a la variable para realizar el enriquecimiento de variables y la ingeniería de características.

nota

Los nombres de las variables de eventos deben estar en minúsculas. Distinguen mayúsculas de minúsculas.

Variables obligatorias

Las siguientes variables son necesarias para entrenar un modelo de Accounts Takeover Insights.

Categoría Tipo de variable Descripción

Dirección IP

IP_ADDRESS

La dirección IP utilizada en el evento de inicio de sesión

Navegador y dispositivo

AGENTE DE USUARIO

El navegador, el dispositivo y el sistema operativo utilizados en el evento de inicio de sesión

Credenciales válidas

CREDO VÁLIDO

Indica si las credenciales que se utilizaron para iniciar sesión son válidas

Variables opcionales

Las siguientes variables son opcionales para entrenar un modelo de Accounts Takeover Insights.

Categoría Tipo Descripción

Navegador y dispositivo

HUELLA DACTILAR

El identificador único de la huella digital de un navegador o dispositivo

ID de sesión

SESSION_ID

El identificador de una sesión de autenticación

Etiqueta

EVENT_LABEL

Una etiqueta que clasifica el evento como fraudulento o legítimo. Puedes usar cualquier etiqueta, como «fraude», «legítimo», «1» o «0".

Timestamp

LABEL_TIMESTAMP

La marca de tiempo de la última actualización de la etiqueta. Esto es obligatorio si se proporciona EVENT_LABEL.

nota
  • Puede proporcionar cualquier nombre de variable para ambas variables obligatorias (variables opcionales). Es importante que cada variable obligatoria y opcional se asigne al tipo de variable correcto.

  • Puede proporcionar variables adicionales. Sin embargo, Amazon Fraud Detector no incluirá estas variables para entrenar un modelo de Accounts Takeover Insights.

Selección de datos

La recopilación de datos es un paso importante para crear su modelo Account Takeover Insights. Cuando comience a recopilar sus datos de inicio de sesión, tenga en cuenta los siguientes requisitos y recomendaciones:

Obligatorio

  • Proporcione al menos 1500 ejemplos de cuentas de usuario, cada uno con al menos dos eventos de inicio de sesión asociados.

  • Tu conjunto de datos debe cubrir al menos 30 días de eventos de inicio de sesión. Más adelante, podrá especificar el intervalo de tiempo específico de los eventos que se utilizarán para entrenar el modelo.

Recomendado

  • Su conjunto de datos incluye ejemplos de eventos de inicio de sesión fallidos. Si lo desea, puede etiquetar estos inicios de sesión fallidos como «fraudulentos» o «legítimos».

  • Prepara datos históricos con eventos de inicio de sesión que abarquen más de seis meses e incluyan 100 000 entidades.

Si aún no tienes un conjunto de datos que cumpla con los requisitos mínimos, considera la posibilidad de transmitir los datos del evento a Amazon Fraud Detector llamando a la operación de SendEventAPI.

Validar los datos

Antes de crear tu modelo Account Takeover Insights, Amazon Fraud Detector comprueba si los metadatos y las variables que incluiste en tu conjunto de datos para entrenar el modelo cumplen los requisitos de tamaño y formato. Para más información, consulte Validación de conjunto de datos.. También comprueba otros requisitos. Si el conjunto de datos no pasa la validación, no se crea el modelo. Para que el modelo se cree correctamente, asegúrate de corregir los datos que no pasaron la validación antes de volver a entrenar.

Errores comunes en los conjuntos de datos

Al validar un conjunto de datos para entrenar un modelo de Account Takeover Insights, Amazon Fraud Detector analiza estos y otros problemas y arroja un error si encuentra uno o más de ellos.

  • El archivo CSV no está en formato UTF-8.

  • El encabezado del archivo CSV no contiene al menos uno de los siguientes metadatos:EVENT_ID,ENTITY_ID, o. EVENT_TIMESTAMP

  • El encabezado del archivo CSV no contiene al menos una variable de los siguientes tipos de variables:IP_ADDRESS,USERAGENT, oVALIDCRED.

  • Hay más de una variable asociada al mismo tipo de variable.

  • Más del 0,1% de los valores EVENT_TIMESTAMP contiene valores nulos o valores distintos de los formatos de fecha y hora admitidos.

  • El número de días entre el primer y el último evento es inferior a 30 días.

  • Más del 10% de las variables de este tipo no son válidas o son nulas. IP_ADDRESS

  • Más del 50% de las variables del tipo de USERAGENT variable contienen valores nulos.

  • Todas las variables del tipo de VALIDCRED variable están configuradas en. false