本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
生成式 AI 工作量评估
Tabby Ward 和 Deepak Dixit,Amazon Web Services ()AWS
2024 年 11 月(文件历史记录)
生成式 AI 工作负载评估是一种战略方法,旨在评估和改善组织创建或更新其生成式 AI 工作负载的准备情况。这种评估很重要,因为将生成式人工智能纳入业务运营可以极大地改变事物的运作方式,并可以提供新的效率和能力。但是,要成功采用生成式人工智能,就必须彻底了解当前的系统并为未来制定明确的计划。
生成式 AI 工作负载是指涉及使用人工智能模型的计算任务,这些模型可以创建新内容,例如文本、图像、代码或其他数据类型。这些工作负载通常需要大量的计算能力、专门的硬件(例如)以及 GPUs用于训练和推理的大型数据集。将生成式 AI 工作负载集成到运营中会带来一些挑战:
-
基础设施要求:配置生成式 AI 模型所需的大量计算资源和专用硬件。
-
数据管理:在处理大型数据集的同时确保数据质量、隐私和合规性。
-
技能差距:缺乏人工智能技术和模型部署方面的专业知识。
-
道德考量:解决人工智能生成内容中的偏见、公平和透明问题。
-
集成复杂性:将生成式 AI 无缝整合到现有工作流程和传统系统中。
-
成本管理:在潜在收益与高昂的实施和运营成本之间取得平衡。
克服这些挑战需要精心规划、基础设施和人才投资以及战略实施方法。
本指南的目的
生成式人工智能正迅速成为许多行业的关键组成部分。它提供了变革性机会,但也带来了集成、合规性和可扩展性方面的挑战。由于技术基础薄弱、变革阻力和数据质量问题,许多组织难以充分利用人工智能。生成式人工智能工作负载评估通过确定现代化的要求、定义实施范围以及挑战传统系统和思维来应对这些挑战。它还有助于确定最低可行产品 (MVPs),并帮助您开发目标解决方案架构,从而确保采用结构化和战略性的方法来采用 AI。
本指南是一种结构化方法,可帮助组织应对采用生成式人工智能技术的复杂性。该指南没有从一开始就明确界定要求,而是提供以下帮助:
-
确定组织内生成式 AI 的潜在用例。
-
评估您的组织是否准备好采用生成式 AI。
-
定义和完善用例目标和延伸目标。
-
确定生成式 AI 实现的范围和要求。
-
开发目标解决方案架构。
目标受众和福利
该评估专为想要评估生成式 AI 工作负载现代化技术方面的解决方案架构师、企业架构师和应用程序架构师而设计。对于想要衡量团队总体准备情况、资源分配和能力需求的项目和人事经理来说,这也很有价值。行业最佳实践强调了全面评估的重要性,以确保为采用人工智能做好准备。这包括评估架构、存储、合规性、集成、测试、部署和自动化。
范围
以下主题属于生成式 AI 工作负载评估方法的范围:
-
当前的生成式 AI 技术和模型(例如,大型语言模型、图像生成模型)
-
使用生成技术的狭窄人工智能应用程序
-
将生成式 AI 与现有系统和工作流程集成
-
用于训练和微调生成式 AI 模型的数据策略
-
当前生成式人工智能应用的道德考虑因素和负责任的人工智能实践
-
生产环境中生成式 AI 的测试和部署策略
-
生成式 AI 实现的安全和隐私注意事项
-
生成式 AI 工作负载的性能优化和可扩展性
-
生成式人工智能在各行各业的用例和应用
-
评估生成式 AI 输出和质量保证流程
以下主题不在范围内:
-
人工通用智能 (AGI) 和人工超级智能 (ASI) 场景
-
除了当前的生成模型之外,人工智能的未来可预测性进步
-
量子计算在人工智能中的应用
-
神经形态计算和脑机接口
-
人工智能系统中的意识和自我意识
-
超越当前生成式人工智能应用的高级人工智能对社会的长期影响
-
假设的未来 AI 技术的监管框架
-
关于机器中智力和意识本质的哲学辩论
-
人工智能的极端边缘案例或高度投机性的用例
-
专有 AI 模型或架构的详细技术规格