IP Insights 推論資料格式 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

IP Insights 推論資料格式

以下是 IP Insights 演算法的可用輸入及輸出格式。Amazon SageMaker 內建演算法會遵循中推論的常見資料格式所述的常見輸入推論格式。但是, SageMaker IP 見解演算法目前不支援 RecordIO 格式。

IP Insights 輸入請求格式

輸入:CSV 格式

CSV 檔案必須擁有兩個欄。第一欄是一個不透明字串,對應到實體的唯一識別符。第二欄則是實體地址事件的 IPv4 地址,以小數點表示法表示。

content-type:text/csv

entity_id_1, 192.168.1.2 entity_id_2, 10.10.1.2

輸入:JSON 格式

JSON 資料可以不同的格式提供。IP 洞察遵循常見的 SageMaker 格式。如需推論格式的詳細資訊,請參閱推論的常見資料格式

content-type:application/json

{ "instances": [ {"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]} ] }

輸入:JSONLINES 格式

JSON Lines 內容類型在執行批次轉換任務時很有用。如需 SageMaker 推論格式的詳細資訊,請參閱推論的常見資料格式。如需執行批次轉換任務的詳細資訊,請參閱使用批次轉換

content-type:application/jsonlines

{"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]}]

IP Insights 輸出回應格式

輸出:JSON 回應格式

SageMaker IP 見解演算法的預設輸出是輸入實體和 IP 位址dot_product之間。dot_product 表示模型考慮實體和 IP 地址的相容程度為何。dot_product 沒有限制。若要針對事件是否異常進行預測,您需要根據您定義的分布設定閾值。如需如何使用進行異常偵測dot_product的相關資訊,請參閱 SageMakerIP 見解演算法簡介

accept:application/json

{ "predictions": [ {"dot_product": 0.0}, {"dot_product": 2.0} ] }

進階使用者可以透過提供額外的 content-type 參數 verbose=True 給 Accept 標頭,來存取模型已學習的實體和 IP 內嵌。您可以使用 entity_embeddingip_embedding 進行除錯、視覺化和了解模型。此外,您可以在其他機器學習技術 (例如分類或叢集) 中使用這些內嵌。

accept:application/json;verbose=True

{ "predictions": [ { "dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0] }, { "dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0] } ] }

輸出:JSONLINES 回應格式

accept:application/jsonlines

{"dot_product": 0.0} {"dot_product": 2.0}

accept:application/jsonlines; verbose=True

{"dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0]} {"dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0]}