本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon SageMaker 模型構建管道
Amazon SageMaker 模型建置管道是一種利用直接 SageMaker 整合功能建立機器學習管道的工具。透過此整合,您可以建立管道並設定 SageMaker 專案以進行協調作業。此設定使用可處理大部分步驟建立和管理的工具。您可以使用 SageMaker Python SDK 建立管線,也可以使用管線定義 JSON 結構描述來編寫SageMaker 管線
SageMaker 相較於其他 AWS 工作流程產品,管道具有下列優勢:
SageMaker 整合
SageMaker 管道與直接整合 SageMaker,因此您不需要與任何其他 AWS 服務互動。您也不需要管理任何資源,因為 P SageMaker ipelines 是完全受控的服務。這表示 SageMaker 管道會為您建立和管理資源。
SageMaker Python 件整合
由於 SageMaker 管道已與 SageMaker Python SDK 整合,因此您可以使用高階 Python 介面以程式設計方式建立管道。若要檢視 SDK SageMaker Python 參考資料,請參閱管線
SageMaker 工作室整合
SageMaker Studio 提供了一個環境來管理 end-to-end SageMaker 管道體驗。使用 Studio,您可以略過 AWS 控制台進行整個工作流程管理。如需有關從 SageMaker Studio SageMaker 管理管道的詳細資訊,請參閱在 SageMaker Studio 中檢視、追蹤和執行 SageMaker 管道。
資料歷程追蹤
使用 Pipeline,您可以在 SageMaker 管道執行中追蹤資料的歷史記錄。Amazon SageMaker ML 歷程追蹤可讓您分析:
-
數據來自哪裡
-
其中的數據被用作輸入
-
從數據生成的輸出
例如,您可以檢視從個別資料集建立的模型,並檢視建立個別模型時所使用的資料集。如需詳細資訊,請參閱 Amazon SageMaker ML 歷程跟踪。
步驟重用
使用 SageMaker 管道,您可以指定快取的步驟。快取步驟時,如果再次執行相同步驟,則會編製索引以供稍後重複使用。然後,您可以在同一管道中重複使用相同步驟的先前步驟執行的輸出,而不必再次執行該步驟。有關步驟緩存的詳細資訊,請參閱快取管道步驟。