Amazon SageMaker 模型構建管道 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker 模型構建管道

Amazon SageMaker 模型建置管道是一種利用直接 SageMaker 整合功能建立機器學習管道的工具。透過此整合,您可以建立管道並設定 SageMaker 專案以進行協調作業。此設定使用可處理大部分步驟建立和管理的工具。您可以使用 SageMaker Python SDK 建立管線,也可以使用管線定義 JSON 結構描述來編寫SageMaker 管線

SageMaker 相較於其他 AWS 工作流程產品,管道具有下列優勢:

SageMaker 整合

SageMaker 管道與直接整合 SageMaker,因此您不需要與任何其他 AWS 服務互動。您也不需要管理任何資源,因為 P SageMaker ipelines 是完全受控的服務。這表示 SageMaker 管道會為您建立和管理資源。

SageMaker Python 件整合

由於 SageMaker 管道已與 SageMaker Python SDK 整合,因此您可以使用高階 Python 介面以程式設計方式建立管道。若要檢視 SDK SageMaker Python 參考資料,請參閱管線。如需 SageMaker Python SDK 程式碼範例,請參閱 Amazon SageMaker 模型建置管道

SageMaker 工作室整合

SageMaker Studio 提供了一個環境來管理 end-to-end SageMaker 管道體驗。使用 Studio,您可以略過 AWS 控制台進行整個工作流程管理。如需有關從 SageMaker Studio SageMaker 管理管道的詳細資訊,請參閱在 SageMaker Studio 中檢視、追蹤和執行 SageMaker 管道

資料歷程追蹤

使用 Pipeline,您可以在 SageMaker 管道執行中追蹤資料的歷史記錄。Amazon SageMaker ML 歷程追蹤可讓您分析:

  • 數據來自哪裡

  • 其中的數據被用作輸入

  • 從數據生成的輸出

例如,您可以檢視從個別資料集建立的模型,並檢視建立個別模型時所使用的資料集。如需詳細資訊,請參閱 Amazon SageMaker ML 歷程跟踪

步驟重用

使用 SageMaker 管道,您可以指定快取的步驟。快取步驟時,如果再次執行相同步驟,則會編製索引以供稍後重複使用。然後,您可以在同一管道中重複使用相同步驟的先前步驟執行的輸出,而不必再次執行該步驟。有關步驟緩存的詳細資訊,請參閱快取管道步驟