Formats de données d'inférence IP Insights - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Formats de données d'inférence IP Insights

Voici les formats d'entrée et de sortie disponibles pour l'algorithme IP Insights. Les algorithmes SageMaker intégrés d'Amazon respectent le format d'inférence d'entrée courant décrit dansFormats de données courants pour l'inférence. Cependant, l'algorithme SageMaker IP Insights ne prend actuellement pas en charge le format RecorDio.

Formats de demande d'entrée IP Insights

ENTRÉE : format CSV

Le fichier CSV doit contenir deux colonnes. La première colonne est une chaîne opaque qui correspond à l'identificateur unique d'une entité. La deuxième colonne est l'adresse IPv4 de l'événement d'accès de l'entité en notation décimale séparée par des points.

content-type: text/csv

entity_id_1, 192.168.1.2 entity_id_2, 10.10.1.2

ENTRÉE : format JSON

Les données JSON peuvent être fournies en différents formats. IP Insights suit les SageMaker formats courants. Pour plus d'informations sur les formats d'inférence, consultez Formats de données courants pour l'inférence.

content-type: application/json

{ "instances": [ {"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]} ] }

ENTRÉE : format JSONLINES

Le type de contenu JSON Lines est utile pour exécuter des tâches de transformation par lots. Pour plus d'informations sur les formats SageMaker d'inférence, consultezFormats de données courants pour l'inférence. Pour plus d'informations sur l'exécution des tâches de transformation par lots, consultez Transformation par lots à des fins d'inférence avec Amazon SageMaker.

content-type: application/jsonlines

{"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]}]

Formats de réponse de sortie IP Insights

SORTIE : format de réponse JSON

La sortie par défaut de l'algorithme SageMaker IP Insights se dot_product situe entre l'entité d'entrée et l'adresse IP. Le paramètre dot_product indique le degré de compatibilité, d'après le modèle, de l'entité et de l'adresse IP. Le paramètre dot_product est sans limite. Pour effectuer des prédictions quant à savoir si un événement est anormal, vous devez définir un seuil en fonction de la distribution définie. Pour plus d'informations sur l'utilisation de l'algorithme dot_product pour la détection des anomalies, consultez l'article Introduction à l'algorithme SageMaker IP Insights.

accept: application/json

{ "predictions": [ {"dot_product": 0.0}, {"dot_product": 2.0} ] }

Les utilisateurs avancés peuvent accéder aux intégrations d'entité et d'adresses IP apprises par le modèle en fournissant le paramètre content-type verbose=True supplémentaire à l'en-tête Accept. Vous pouvez utiliser les paramètres entity_embedding et ip_embedding pour déboguer, visualiser et comprendre le modèle. En outre, vous pouvez utiliser ces intégrations dans d'autres techniques de machine learning, comme la classification ou la mise en cluster.

accept: application/json;verbose=True

{ "predictions": [ { "dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0] }, { "dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0] } ] }

SORTIE : format de réponse JSONLINES

accept: application/jsonlines

{"dot_product": 0.0} {"dot_product": 2.0}

accept: application/jsonlines; verbose=True

{"dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0]} {"dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0]}