本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
最佳實務
本節提供 MLOps AWS 最佳實務的概觀。
帳戶管理和區隔
帳戶管理的AWS 最佳實務建議您為每個使用案例將帳戶分成四個帳戶:實驗、開發、測試和生產。擁有一個負責在整個組織中提供共用 MLOP 資源的控管帳戶以及一個負責提供集中式資料存取的資料湖帳戶也是一種最佳實務。這樣做的理由是將開發、測試和生產環境完全分開,避免因多個使用案例和資料科學團隊共用相同帳戶集而受到服務限制所造成的延遲,並提供每個使用案例成本的完整概觀。最後,分隔帳戶層級資料是最佳實務,因為每個使用案例都有自己的一組帳戶。
安全標準
為了符合安全需求,最佳實務是關閉公有網際網路存取,並使用自訂金鑰加密所有資料。然後,您可以使用 Service Catalog,在幾分鐘內將 Amazon SageMaker AI Studio 的安全執行個體部署到開發帳戶。您也可以透過使用 SageMaker AI Projects 部署的範本,使用 SageMaker AI 來取得每個使用案例的稽核和模型監控功能。
使用案例功能
帳戶設定完成後,您組織的資料科學家可以使用 SageMaker AI Studio 中的 SageMaker AI 專案來請求新的使用案例範本。此流程會部署必要的基礎設施以在開發帳戶中擁有 MLOps 功能 (中央團隊只需要最少的支援),例如 CI/CD 管道、單元測試、模型測試和模型監控。
然後,每個使用案例都會經過開發 (或在現有應用程式程式碼庫的情況下進行重構),以使用 SageMaker AI 功能在 SageMaker AI 架構中執行,例如實驗追蹤、模型可解釋性、偏差偵測和資料/模型品質監控。您可以使用 SageMaker AI Pipelines 中的管道步驟,將這些功能新增至每個使用案例管道。
MLOps 成熟度旅程
MLOP 成熟度旅程定義在公司範圍設定中提供的必要 MLOps 功能,以確保端對端模型工作流程已到位。成熟度旅程包括四個階段:
初始 – 在此階段中建立實驗帳戶。您也可以保護組織內的新 AWS 帳戶,讓您可以在其中試驗 SageMaker Studio 和其他新 AWS 服務。
可重複 – 在此階段中,將程式碼儲存庫和 ML 解決方案開發標準化。您也會採用多帳戶實作方法,並將程式碼儲存庫標準化,以便在橫向擴展產品時支援模型控管和模型稽核。最佳實務是採用生產就緒模型開發方法以及控管帳戶所提供的標準解決方案。資料會儲存在資料湖帳戶中,而在兩個帳戶中開發使用案例。第一個帳戶用於資料科學探索期間的實驗。在此帳戶中,資料科學家發現了解決業務問題的模型,並嘗試多種可能性。另一個帳戶用於開發,這是在確定了最佳模型並且資料科學團隊準備好在推論管道中工作之後進行的。
可靠 – 在此階段中,您將介紹測試、部署和多帳戶部署。您必須了解 MLOps 需求並引入自動化測試。實作 MLOps 最佳實務,以確保模型穩固且安全。在此階段中,介紹兩個新的使用案例帳戶:用於測試在模擬生產環境的環境中開發的模型的測試帳戶,以及用於在業務操作期間執行模型推論的生產帳戶。最後,在多帳戶設定中使用自動化模型測試、部署和監控,以確保您的模型滿足您設定的高品質和效能標準。
可擴展 – 在此階段中,您可以將多個 ML 解決方案範本化和生產化。在端對端模型建置過程中,多個團隊和 ML 使用案例開始採用 MLOps。為了在此階段實現可擴展性,您還可以透過更廣泛的資料科學家的貢獻來增加範本庫中的範本數量,為組織中的更多團隊減少從想法到生產模型中的價值實現時間,並在擴展時進行迭代。
如需 MLOps 成熟度模型的詳細資訊,請參閱 AWS Machine Learning部落格上的適用於使用 Amazon SageMaker AI 之企業的 MLOps 基礎藍圖