本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
中的模型部署 SageMaker
訓練並核准生產模型後,請使用 SageMaker 將模型部署到端點以進行即時推論。 SageMaker 提供多個推論選項,讓您選擇最適合工作負載的選項。您也可以透過選擇執行個體類型和執行個體數量來設定端點,以獲得最佳效能。如需與模型部署相關的詳細資訊,請參閱部署用於推論的模型。
將模型部署到生產環境之後,您可能想要探索進一步最佳化模型效能的方法,同時維持目前模型的可用性。例如,您可以設定影子測試,在承諾變更之前,先嘗試不同的模型或模型服務基礎設施。 會在影子模式下 SageMaker 部署新模型、容器或執行個體,並在相同端點內即時路由至其推論請求的副本。您可以記錄陰影變體的回應,以便進行比較。如需與陰影測試相關的詳細資訊,請參閱陰影測試。如果您決定繼續變更模型,可以透過部署防護機制控制從目前模型到新模型的切換。您能為流量轉移程序選取藍/綠或 Canary 測試等方法,以便在更新期間維持精細控制。如需與部署防護機制相關的詳細資訊,請參閱用於更新生產中模型的部署防護措施。