本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
生成式 AI 工作負載評估
Tabby Ward 和 Deepak Dixit,Amazon Web Services (AWS)
2024 年 11 月 (文件歷史記錄)
生成式 AI 工作負載評估是一種策略方法,旨在評估和改善組織建立或更新生成式 AI 工作負載的準備程度。此評估很重要,因為將生成式 AI 整合到業務營運中可能會大幅改變物件的運作方式,並可提供新的效率和功能。不過,若要成功採用生成式 AI,請務必徹底了解目前的系統,並制定明確的未來計畫。
生成式 AI 工作負載是指涉及使用人工智慧模型來建立新內容的運算任務,例如文字、影像、程式碼或其他資料類型。這些工作負載通常需要強大的運算能力、專業的硬體,例如 GPUs,以及用於訓練和推論的大型資料集。將生成式 AI 工作負載整合到操作中,有幾個挑戰:
-
基礎設施需求:佈建生成式 AI 模型所需的重要運算資源和專用硬體。
-
資料管理:在處理大型資料集時確保資料品質、隱私權和合規性。
-
技能差距:缺乏 AI 技術和模型部署方面的專業知識。
-
道德考量:解決 AI 產生內容中的偏差、公平性和透明度。
-
整合複雜性:將生成式 AI 無縫整合到現有的工作流程和舊版系統中。
-
成本管理:在潛在利益與高實作和操作成本之間取得平衡。
克服這些挑戰需要仔細規劃、投資基礎設施和人才,以及實施的策略方法。
本指南的目的
生成式 AI 迅速成為許多產業的重要元件。它提供轉型機會,但在整合、合規和可擴展性方面也帶來挑戰。由於技術基礎薄弱、變革阻力和資料品質問題,許多組織難以充分利用 AI。生成式 AI 工作負載評估透過識別現代化需求、定義實作範圍以及具有挑戰性的傳統系統和思維來解決這些挑戰。它還有助於確定最低可行產品 (MVPs),並協助您開發目標解決方案架構,確保採用 AI 的結構化和策略方法。
本指南提供結構化的方法,協助組織應對採用生成式 AI 技術的複雜性。本指南不會從一開始就明確定義需求,而是協助:
-
識別組織內生成式 AI 的潛在使用案例。
-
評估組織是否準備好採用生成式 AI。
-
定義和精簡使用案例目標和延伸目標。
-
決定生成式 AI 實作的範圍和需求。
-
開發目標解決方案架構。
目標受眾和優勢
此評估專為想要評估生成式 AI 工作負載現代化技術層面的解決方案架構師、企業架構師和應用程式架構師而設計。對於想要衡量團隊整體整備度、資源分配和啟用需求的計畫和人事經理來說,這也很有價值。產業最佳實務強調全面評估的重要性,以確保 AI 採用的準備程度。這包括評估架構、儲存、合規、整合、測試、部署和自動化。
範圍
下列主題在生成式 AI 工作負載評估方法的範圍內:
-
目前的生成式 AI 技術和模型 (例如,大型語言模型、影像產生模型)
-
使用生成式技術的窄版 AI 應用程式
-
生成式 AI 與現有系統和工作流程的整合
-
用於訓練和微調生成式 AI 模型的資料策略
-
目前生成式 AI 應用程式的道德考量和負責任的 AI 實務
-
在生產環境中測試和部署生成式 AI 的策略
-
生成式 AI 實作的安全性和隱私權考量
-
生成式 AI 工作負載的效能最佳化和可擴展性
-
各種產業中生成式 AI 的使用案例和應用程式
-
評估生成式 AI 輸出和品質保證程序
下列主題超出範圍:
-
人工智慧 (AGI) 和人工超智慧 (ASI) 案例
-
AI 在目前生成模型之外的推測未來進展
-
AI 中的量子運算應用程式
-
神經變形運算和大腦電腦界面
-
AI 系統中的意識和自我意識
-
除了目前產生的 AI 應用程式之外,進階 AI 的長期社會影響
-
假設性未來 AI 技術的法規架構
-
哲學爭論機器中智慧和意識的本質
-
AI 極端邊緣案例或高度投機的使用案例
-
專屬 AI 模型或架構的詳細技術規格