Formatos de dados de inferência para IP Insights - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Formatos de dados de inferência para IP Insights

Veja a seguir os formatos de entrada e saída disponíveis para o algoritmo de IP Insights. Os algoritmos SageMaker integrados da Amazon seguem o formato comum de inferência de entrada descrito emFormatos de dados comuns para inferência. No entanto, o algoritmo SageMaker IP Insights atualmente não oferece suporte ao formato ReCordio.

Formatos de solicitação de entrada para IP Insights

ENTRADA: Formato CSV

O arquivo CSV deve ter duas colunas. A primeira coluna é uma string opaca que corresponde ao identificador exclusivo de uma entidade. A segunda coluna é o endereço IPv4 do evento de acesso da entidade na notação de pontos decimais.

content-type: text/csv

entity_id_1, 192.168.1.2 entity_id_2, 10.10.1.2

ENTRADA: Formato JSON

Os dados JSON podem ser fornecidos em diferentes formatos. O IP Insights segue os SageMaker formatos comuns. Para obter mais informações sobre formatos de inferência, consulte Formatos de dados comuns para inferência.

content-type: application/json

{ "instances": [ {"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]} ] }

ENTRADA: Formato JSONLINES

O tipo de conteúdo JSON Lines é útil para realizar trabalhos de transformação em lote. Para obter mais informações sobre formatos de SageMaker inferência, consulteFormatos de dados comuns para inferência. Para obter mais informações sobre a execução de trabalhos de transformação em lote, consulte Usar transformação em lote.

content-type: application/jsonlines

{"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]}]

Formatos de resposta de saída para IP Insights

SAÍDA: Formato de resposta JSON

A saída padrão do algoritmo SageMaker IP Insights é dot_product entre a entidade de entrada e o endereço IP. O dot_product significa quão compatíveis o modelo considera a entidade e o endereço IP. O dot_product é não vinculado. Para fazer previsões sobre se um evento é anômalo, você precisa estipular um limite com base na sua distribuição definida. Para obter informações sobre como usar o dot_product para detecção de anomalias, consulte Uma introdução ao algoritmo SageMaker IP Insights.

accept: application/json

{ "predictions": [ {"dot_product": 0.0}, {"dot_product": 2.0} ] }

Os usuários avançados podem acessar as incorporações de entidades e endereços IP aprendidas do modelo, fornecendo o parâmetro content-type verbose=True adicional ao cabeçalho Accept. É possível usar entity_embedding e ip_embedding para depurar, visualizar e entender o modelo. Além disso, você pode usar essas incorporações em outras técnicas de machine learning, como classificação ou agrupamento.

accept: application/json;verbose=True

{ "predictions": [ { "dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0] }, { "dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0] } ] }

SAÍDA: Formato de resposta JSONLINES

accept: application/jsonlines

{"dot_product": 0.0} {"dot_product": 2.0}

accept: application/jsonlines; verbose=True

{"dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0]} {"dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0]}