COST11-BP01 执行运营自动化
评估云上运营工作量的成本。量化使用自动化之后管理任务、部署和其他运营工作减少的时间和工作量。评估运营工作所需的时间和成本,并自动执行管理任务,以尽可能减少人工工作量。
在未建立这种最佳实践的情况下暴露的风险等级:低
自动执行运营可解放人力资源和改善指标,从而提高一致性和可扩展性、实现更高的可见性、可靠性和灵活性、降低成本以及加快创新。还可以在部署、管理或运营工作负载时提供一致且可靠的体验,从而降低手动任务的频率、提高效率以及使企业受益。您可以将基础设施资源从手动操作任务中解放出来,并将它们用于更高价值的任务和创新,从而改善业务成果。企业需要行之有效、经过测试的方法来管理他们在云中的工作负载。该解决方案必须安全、快速和经济高效,风险最小且可靠性最高。
首先着眼于云中的总体运营成本,根据所需的工作量确定运营优先级。例如,在云中部署新资源、对现有资源进行优化更改或实施必要的配置需要多长时间? 考虑运营和管理成本,看看人工行为的总成本。优先考虑管理任务的自动化,以减少人工工作量。审核工作应该体现可能带来的好处。例如,与自动执行任务相比,手动执行任务所花费的时间。优先考虑自动执行重复、高价值的活动。从那些人为错误风险更高的活动开始实现自动化通常会更好,因为风险通常会带来不必要的额外运营成本(例如,运营团队加班产生的成本)。
使用 AWS 服务、工具或第三方产品,您可以选择要实施哪些 AWS 自动化,并根据您的特定需求进行定制。下表显示了您为了自动执行管理和运营而可以通过 AWS 服务实现的一些核心运营职能和能力:
-
AWS Audit Manager
:持续审计您的 AWS 使用情况,以便简化风险和合规性评测 -
AWS Backup
:集中管理和自动执行数据保护。 -
AWS Config
:配置计算资源、评测、审计和评估配置与资源清单。 -
AWS CloudFormation
:使用基础设施即代码启动高可用性资源。 -
AWS CloudTrail
:IT 变更管理、合规性和控制。 -
Amazon EventBridge
:安排事件并触发 AWS Lambda 以采取行动。 -
AWS Lambda
:通过事件触发流程或使用 Amazon EventBridge 按固定时间表运行流程,使重复流程实现自动化。 -
AWS Systems Manager
:启动和停止工作负载、修补操作系统、自动配置和持续管理。 -
AWS Step Functions
:安排作业和自动执行工作流。 -
AWS Service Catalog
:具有合规性和控制的模板使用和基础设施即代码。
利用节省下来的时间,您的团队将能够专注于解决技术债务、创新和增值功能。例如,您可能需要尽快将本地环境直接迁移到云,然后再进行优化。值得探索的是,通过使用可消除或减少许可证成本的完全托管式 AWS 服务(例如,Amazon Relational Database Service
如果您希望使用 AWS 产品和服务立即采用自动化,而您的组织中没有相应的技能,请联系 AWS Managed Services(AMS)
AWS Managed Services(AMS)
AWS Professional Services
实施步骤
-
一次构建,多次部署:使用基础设施即代码 [例如 AWS CloudFormation、AWS SDK 或 AWS Command Line Interface(AWS CLI)],对于同一环境或灾难恢复场景,只部署一次,多次使用。在部署时进行标记,以便按照其他最佳实践中的规定跟踪您的使用情况。使用 AWS Launch Wizard
以缩短部署许多常用企业工作负载的时间。AWS Launch Wizard 会指导您按照 AWS 最佳实践完成企业工作负载的大小调整、配置和部署。您还可以使用 AWS Service Catalog 帮助创建和管理经批准的基础设施即代码模板,在 AWS 上使用,以便任何人都可以发现经批准的自助式云资源。 -
自动操作:自动运行日常操作,无需人工干预。使用 AWS 服务和工具,您可以选择要实施哪些 AWS 自动化,并根据您的特定需求进行定制。例如,使用 EC2 Image Builder
来构建、测试和部署虚拟机和容器映像,以在 AWS 或在本地使用。如果无法使用 AWS 服务完成您的期望操作或您需要使用筛选资源的更复杂操作,则使用 AWS CLI 或 AWS SDK 工具自动执行操作。AWS CLI 可以通过脚本自动完成控制和管理 AWS 服务的整个过程,而无需使用 AWS 控制台。选择您首选的 AWS SDK 与 AWS 服务交互。有关其他代码示例,请参阅 AWS SDK 代码示例库 。
资源
相关文档:
相关示例: