Formats de données d'inférence IP Insights

Voici les formats d'entrée et de sortie disponibles pour l'algorithme IP Insights. Les algorithmes intégrés d'Amazon SageMaker AI respectent le format d'inférence d'entrée courant décrit dansFormats de données courants pour l'inférence. Cependant, l'algorithme SageMaker AI IP Insights ne prend actuellement pas en charge le format Recordio.

Formats de demande d'entrée IP Insights

ENTRÉE : format CSV

Le fichier CSV doit contenir deux colonnes. La première colonne est une chaîne opaque qui correspond à l'identificateur unique d'une entité. La deuxième colonne est l' IPv4 adresse de l'événement d'accès de l'entité en notation décimale.

content-type: text/csv


entity_id_1, 192.168.1.2
entity_id_2, 10.10.1.2

ENTRÉE : format JSON

Les données JSON peuvent être fournies en différents formats. IP Insights suit les formats d' SageMaker IA courants. Pour plus d'informations sur les formats d'inférence, consultez Formats de données courants pour l'inférence.

content-type: application/json


{
  "instances": [
    {"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}},
    {"features": ["entity_id_2", "10.10.1.2"]}
  ]
}

ENTRÉE : format JSONLINES

Le type de contenu JSON Lines est utile pour exécuter des tâches de transformation par lots. Pour plus d'informations sur les formats d'inférence basés sur l' SageMaker IA, consultezFormats de données courants pour l'inférence. Pour plus d'informations sur l'exécution des tâches de transformation par lots, consultez Transformation par lots à des fins d'inférence avec Amazon AI SageMaker .

content-type: application/jsonlines


{"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}},
{"features": ["entity_id_2", "10.10.1.2"]}]

Formats de réponse de sortie IP Insights

SORTIE : format de réponse JSON

La sortie par défaut de l'algorithme SageMaker AI IP Insights se dot_product situe entre l'entité d'entrée et l'adresse IP. Le paramètre dot_product indique le degré de compatibilité, d'après le modèle, de l'entité et de l'adresse IP. Le paramètre dot_product est sans limite. Pour effectuer des prédictions quant à savoir si un événement est anormal, vous devez définir un seuil en fonction de la distribution définie. Pour plus d'informations sur l'utilisation de l'algorithme dot_product pour la détection des anomalies, consultez l'ouvrage An Introduction to the SageMaker AIIP Insights Algorithm.

accept: application/json


{
  "predictions": [
    {"dot_product": 0.0},
    {"dot_product": 2.0}
  ]
}

Les utilisateurs avancés peuvent accéder aux intégrations d'entité et d'adresses IP apprises par le modèle en fournissant le paramètre content-type verbose=True supplémentaire à l'en-tête Accept. Vous pouvez utiliser les paramètres entity_embedding et ip_embedding pour déboguer, visualiser et comprendre le modèle. En outre, vous pouvez utiliser ces intégrations dans d'autres techniques de machine learning, comme la classification ou la mise en cluster.

accept: application/json;verbose=True


{
  "predictions": [
    {
        "dot_product": 0.0,
        "entity_embedding": [1.0, 0.0, 0.0],
        "ip_embedding": [0.0, 1.0, 0.0]
    },
    {
        "dot_product": 2.0,
        "entity_embedding": [1.0, 0.0, 1.0],
        "ip_embedding": [1.0, 0.0, 1.0]
    }
  ]
}

SORTIE : format de réponse JSONLINES

accept: application/jsonlines


{"dot_product": 0.0}
{"dot_product": 2.0}

accept: application/jsonlines; verbose=True


{"dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0]}
{"dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0]}

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Entraînement

Algorithme des k-moyennes (k-means)