2. 實驗 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

2. 實驗

實驗涵蓋實驗記錄、追蹤和指標。這可轉譯為跨平台、來源控制和開發環境中的實驗中繼資料整合。實驗還包括能夠透過偵錯來最佳化模型效能和準確性。

2.1 整合式開發環境

整合的開發環境 (IDE) 直接與雲端整合。IDE 可以與較大的系統互動,並將命令提交至較大的系統。理想情況下,它支援下列項目:

  • 本機開發

  • 版本控制整合

  • 就地除錯,所有產生的日誌和成品都會進入版本控制

2.2 程式碼版本控制

為了協助確保可再現性和可重複使用性,所有程式碼都會透過適當的版本控制遞交至來源儲存庫。這包括基礎設施程式碼、應用程式程式碼、模型程式碼,甚至是筆記本 (如果您選擇使用它們)。

2.3 追蹤

ML 專案需要可追蹤和分析機器學習實驗的工具。此工具應在機器學習實驗執行期間記錄所有指標、參數和成品,並將所有中繼資料記錄到中央位置。中央位置將提供分析、視覺化和稽核您執行的所有實驗的能力。

2.4 跨平台整合

您可以在系統的其他部分存取實驗的歷史結果及其所有中繼資料。例如,就地的協調管道可以存取此資料,監控工具也是如此。

2.5 偵錯:準確性和系統效能

已備妥完整的模型偵錯架構,以檢查下列執行:

  • 尋找瓶頸

  • 異常的提醒

  • 最大化資源使用率

  • 協助分析實驗

當訓練密集時,最大化輸送量的能力至關重要,並使此成為成本最佳化的必要工具。