Formats de données d'inférence IP Insights - Amazon SageMaker

Formats de données d'inférence IP Insights

Voici les formats d'entrée et de sortie disponibles pour l'algorithme IP Insights. Les algorithmes intégrés Amazon SageMaker respectent le format d'inférence d'entrée courant décrit dans Formats de données courants à l'inférence. Toutefois, actuellement, l'algorithme IP Insights de SageMaker ne prend pas en charge le format RecordIO.

Formats de demande d'entrée IP Insights

ENTRÉE : format CSV

Le fichier CSV doit contenir deux colonnes. La première colonne est une chaîne opaque qui correspond à l'identificateur unique d'une entité. La deuxième colonne est l'adresse IPv4 de l'événement d'accès de l'entité en notation décimale séparée par des points.

content-type: text/csv

entity_id_1, 192.168.1.2 entity_id_2, 10.10.1.2

ENTRÉE : format JSON

Les données JSON peuvent être fournies en différents formats. IP Insights utilise les formats SageMaker courants. Pour plus d'informations sur les formats d'inférence, consultez Formats de données courants à l'inférence.

content-type: application/json

{ "instances": [ {"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]} ] }

ENTRÉE : format JSONLINES

Le type de contenu JSON Lines est utile pour exécuter des tâches de transformation par lots. Pour plus d'informations sur les formats d'inférence de SageMaker, consultez Formats de données courants à l'inférence. Pour plus d'informations sur l'exécution des tâches de transformation par lots, consultez Utilisation de la transformation par lots.

content-type: application/jsonlines

{"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]}]

Formats de réponse de sortie IP Insights

SORTIE : format de réponse JSON

La sortie par défaut de l'algorithme IP Insights de SageMaker est la valeur dot_product entre l'entité d'entrée et l'adresse IP. Le paramètre dot_product indique le degré de compatibilité, d'après le modèle, de l'entité et de l'adresse IP. Le paramètre dot_product est sans limite. Pour effectuer des prédictions quant à savoir si un événement est anormal, vous devez définir un seuil en fonction de la distribution définie. Pour plus d'informations sur la façon d'utiliser le paramètre dot_product pour la détection d'anomalies, consultez l'article relatif à la présentation de l'algorithme IP Insights de SageMaker.

accept: application/json

{ "predictions": [ {"dot_product": 0.0}, {"dot_product": 2.0} ] }

Les utilisateurs avancés peuvent accéder aux intégrations d'entité et d'adresses IP apprises par le modèle en fournissant le paramètre content-type verbose=True supplémentaire à l'en-tête Accept. Vous pouvez utiliser les paramètres entity_embedding et ip_embedding pour déboguer, visualiser et comprendre le modèle. En outre, vous pouvez utiliser ces intégrations dans d'autres techniques de machine learning, comme la classification ou la mise en cluster.

accept: application/json;verbose=True

{ "predictions": [ { "dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0] }, { "dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0] } ] }

SORTIE : format de réponse JSONLINES

accept: application/jsonlines

{"dot_product": 0.0} {"dot_product": 2.0}

accept: application/jsonlines; verbose=True

{"dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0]} {"dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0]}