2. 实验 - AWS 規定指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

2. 实验

實驗涵蓋實驗記錄、追蹤和指標。這可轉化為跨平台、原始檔控制和開發環境中實驗中繼資料整合。實驗還包括能夠通過調試優化模型性能和準確性。

2.1 整合式開發環境

整合式開發環境 (IDE) 會直接與雲端整合。IDE 可以與更大的系統進行交互並提交命令。理想情況下,它支持以下內容:

  • 本機開發

  • 版本控制整合

  • 調試到位,所有生成的日誌和成品都進入版本控制

2.2 程式碼版本控制

為了確保可重複性和可重複使用性,所有代碼都通過適當的版本控制提交到源存儲庫中。這包括基礎結構代碼,應用程序代碼,模型代碼,甚至筆記本(如果您選擇使用它們)。

2.3 追蹤中

ML 專案需要可追蹤和分析機器學習實驗的工具。此工具應在機器學習實驗執行期間記錄所有度量、參數和成品,並將所有中繼資料記錄到集中位置。中央位置將提供分析、視覺化和稽核您執行的所有實驗的功能。

2.4 跨平台整合

實驗的歷史結果及其所有元數據都可以在系統的其他部分中訪問。例如,就地的協調流程管道可以存取此資料,監視工具也可以存取。

2.5 調試:準確性和系統性能

全面的模型除錯架構可用來檢查下列項目的執行:

  • 找到瓶頸

  • 有關異常的警報

  • 最大化資源使用

  • 在實驗分析的援助

當訓練密集時,最大化輸送量的能力至關重要,因此成為成本最佳化的必要工具。