資料擷取 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

資料擷取

若要將端點的輸入和從部署模型的推論輸出記錄到 Amazon S3,您可以啟用名為資料擷取的功能。資料擷取通常用來記錄可用於訓練、偵錯和監控的資訊。Amazon SageMaker Model Monitor 會自動剖析此擷取的資料,並將來自此資料的指標與您為模型建立的基準進行比較。如需有關模型監控的更多相關資訊,請參閱使用 Amazon Model Monitor 進行資料和 SageMaker 模型品質監控

您可以使用 AWS SDK for Python (Boto) 或 SageMaker Python 實作即時和批次模型監控模式的資料擷取SDK。如果是即時端點,您將在建立端點時指定資料擷取組態。由於即時端點的持續性質,您可以設定額外選項以在特定時間開啟或關閉資料擷取,或變更取樣頻率。您也可以選擇加密推論資料。

對於批次轉換工作,如果您想要針對一般、定期的批次轉換工作執行排程模型監控或持續模型監控,則可以啟用資料擷取。您將在建立批次轉換工作時指定資料擷取組態。在此組態中,您可以選擇開啟加密或在輸出中產生推論 ID,以協助您將擷取的資料與 Ground Truth 資料比對。