Formatos de datos de inferencia de Información IP - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Formatos de datos de inferencia de Información IP

Lo que sigue son los formatos de entrada y salida disponibles para el algoritmo IP Insights. Los algoritmos SageMaker integrados de Amazon siguen el formato de inferencia de entrada común descrito enFormatos de datos comunes para inferencias. Sin embargo, el algoritmo SageMaker IP Insights no admite actualmente el formato Recordio.

Formatos de solicitud de entrada de Información IP

INPUT: Formato CSV

El archivo CSV debe tener dos columnas. La primera columna es una cadena opaca que corresponde a un identificador único de la entidad. La segunda columna es la dirección IPv4 del evento de acceso de la entidad en formato decimal con punto.

content-type: text/csv

entity_id_1, 192.168.1.2 entity_id_2, 10.10.1.2

INPUT: Formato JSON

Los datos JSON se puede proporcionar en diferentes formatos. IP Insights sigue los SageMaker formatos habituales. Para obtener más información sobre los formatos de inferencia, consulte Formatos de datos comunes para inferencias.

content-type: application/json

{ "instances": [ {"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]} ] }

INPUT: Formato JSONLINES

El tipo de contenido JSON Lines es útil para la ejecución de los trabajos de transformación por lotes. Para obtener más información sobre los formatos de SageMaker inferencia, consulteFormatos de datos comunes para inferencias. Para obtener más información sobre la ejecución de los trabajos de transformación por lotes, consulte Transformación por lotes para inferencias con Amazon SageMaker.

content-type: application/jsonlines

{"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]}]

Formatos de respuesta de salida de Información IP

SALIDA: Formato de respuesta JSON

La salida predeterminada del algoritmo SageMaker IP Insights es la que se encuentra dot_product entre la entidad de entrada y la dirección IP. El dot_product indica el grado de compatibilidad de la entidad y dirección IP según lo determina el modelo. El dot_product es ilimitado. Para realizar predicciones sobre si un evento es anómalo, debe establecer un umbral basado en función de su distribución definida. Para obtener información sobre cómo utilizarlos dot_product para la detección de anomalías, consulte Introducción al algoritmo SageMaker IP Insights.

accept: application/json

{ "predictions": [ {"dot_product": 0.0}, {"dot_product": 2.0} ] }

Los usuarios avanzados pueden acceder a la entidad aprendida del modelo e incrustaciones IP proporcionando el parámetro de tipo de contenido adicional verbose=True en el encabezado Aceptar. Puede utilizar entity_embedding e ip_embedding para la depuración, visualización y comprensión del modelo. Además, puede utilizar estas incrustaciones en otras técnicas de machine learning, como clasificación clustering.

accept: application/json;verbose=True

{ "predictions": [ { "dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0] }, { "dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0] } ] }

SALIDA: Formato de respuesta JSONLINES

accept: application/jsonlines

{"dot_product": 0.0} {"dot_product": 2.0}

accept: application/jsonlines; verbose=True

{"dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0]} {"dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0]}