8. 持續訓練 - AWS 規定指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

8. 持續訓練

持續訓練意味著 ML 系統會自動且持續地重新訓練機器學習模型,以便在重新部署資料之前適應資料的變更。重建的可能觸發程序包括資料變更、模型變更或程式碼變更。

8.1 檢查:模型輸入驗證

檢查已到位,以驗證模型的輸入不會偏離某個標準。輸入驗證是指在模型推廣期間執行功能測試。這也意味著具有輸入請求的立即驗證,例如使用斷言和枚舉類型。

8.2 重新訓練觸發:已排定的工作

這是培訓自動化的最基本形式。模型重新訓練是根據排程設定的 (例如,每週)。在此案例中,自動化可能很低,在模型升級之前,請手動檢閱並對結果進行即時檢查。

8.3 重新訓練觸發:新的訓練資料

重新訓練是由內送資料臨界值啟動。模型可以從頭開始重新訓練,也可以逐步執行更新。如果有指定數量的資料,訓練工作就會開始。

8.4 重新訓練觸發:模型效能下降

此技術使用監視和可觀測性來執行模型再訓練,而且需要成熟的自動化層級。例如,精確度會從給定的範圍降低,該範圍充當在全部或部分資料上重新訓練模型的觸發器。

8.5 重新訓練觸發:資料分配偏移

監視資料分佈偏移提供了一種方式,可在基礎資料變更時重新訓練模型集觸發程序。違規設定於概念轉移或資料分佈偏移啟動模型再訓練工作。