Amazon SageMaker 推論推薦 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker 推論推薦

Amazon SageMaker 推論推薦程式是 Amazon SageMaker 的一項功能,可透過自動執行跨 SageMaker ML 執行個體的負載測試和模型調整,減少在生產環境中取得機器學習 (ML) 模型所需的時間。您可以使用 Inference Recommender 將模型部署到即時或無伺服器推論端點,以最低的成本提供最佳效能。Inference Recommender 可協助您為 ML 模型和工作負載選取最佳的執行個體類型及組態 (例如執行個體計數、容器參數和模型最佳化) 或無伺服器組態 (例如最大並行數和記憶體大小)。

Amazon SageMaker 推論建議程式只會針對執行任務時使用的執行個體收費。

運作方式

若要使用 Amazon SageMaker 推論建議程式,您可以使用 SageMaker 模型成品建立模型或在模 SageMaker 型登錄中註冊模型。使用AWS SDK for Python (Boto3)或 SageMaker 控制台針對不同的 SageMaker端點組態執行基準測試工作。Inference Recommender 任務可幫助您收集效能和資源使用率的指標並以視覺化方式呈現,以協助您決定要選擇的端點類型和組態。

如何開始

如果您是 Amazon SageMaker 推論推薦人的首次使用者,我們建議您執行下列動作:

  1. 請仔細閱讀必要條件本節,確定您已滿足使用 Amazon SageMaker 推論推薦程式的需求。

  2. 請仔細閱讀 建議任務 一節,以啟動您的第一個 Inference Recommender 建議任務。

  3. 探索介紹性的 Amazon SageMaker 推論推薦程式 Jupyter 筆記本範例,或檢閱下一節中的範例筆記本。

範例筆記本

下列 Jupyter 筆記本範例可協助您處理 Inference Recommender 中多個使用案例的工作流程: