COST02-BP01 根据您的组织要求制定政策 - 成本优化支柱

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

COST02-BP01 根据您的组织要求制定政策

制定策略,确定组织应该如何管理资源,并定期执行检查。策略应该涵盖资源和工作负载的成本,包括在资源生命周期内的创建、修改和停用。

在未建立这种最佳实践的情况下暴露的风险等级:

实施指导

了解组织的成本和驱动因素,对于有效管理成本和使用情况以及找到降低成本的机会至关重要。在组织中,通常会有多个团队运行多个工作负载。这些团队可能在不同的组织单位,每个单位都有自己的收入来源。将资源成本分摊到工作负载、各个组织或产品负责人,这样既推动更高效的资源使用模式,又能减少浪费。准确的成本和使用情况监控有助于您了解如何优化工作负载,以及各部门和产品的盈利能力。利用这些知识,可以就在组织内的何处分配资源作出更明智的决策。组织中各层级的人员都了解使用情况是推动变化的关键,因为使用情况变化会导致成本变化。考虑采用多元方法来了解使用情况和支出情况。

执行治理的第一步是按照组织要求来针对云的使用制定策略。这些策略定义组织如何使用云以及如何管理资源。策略应涵盖与成本或使用情况有关的资源和工作负载的所有方面,包括资源生命周期内的创建、修改和停用。确认云环境中的任何更改都是遵循相应策略和程序实施的。在 IT 变更管理会议期间,提出问题以了解计划变更的成本影响(无论是增加还是减少)、业务理由以及预期结果。

策略应该简单易懂,能够在整个组织中有效实施。策略还需要易于遵守和解释(以便落实),并且要具体(不会在各团队之间造成误解)。此外,需要定期审查这些策略(例如我们的机制),并在客户业务状况或业务优先级发生变化时及时更新策略,以免导致策略过时。

从广泛的、高层级的策略开始,例如使用哪个地理区域,或者一天中应该运行资源的时间。逐步为各组织单位和工作负载细化策略。常见策略包括可以使用哪些服务和功能(例如,测试和开发环境中性能较低的存储),哪些类型的资源可供不同团队使用(例如,开发账户中最大规模的资源为中等大小),以及这些资源将使用多长时间(可能是临时使用、短期使用或在特定时间段内使用)。

策略示例

以下是侧重于成本优化的策略示例,可以参考该策略来创建自己的云治理策略。请确保根据组织和利益相关方的要求调整策略。

  • 策略名称:定义清晰的策略名称,例如“资源优化和成本削减策略”。

  • 目的:解释为什么应使用此策略以及预期结果如何。此策略的目标是确认,在为了满足业务要求而部署和运行所需工作负载方面,有最低的成本要求。

  • 范围:明确定义谁应该使用本政策以及何时应该使用该政策,例如 DevOps X Team 在 X 环境(生产或非生产)的美国东部客户中使用此政策。

策略声明

  1. 根据工作负载的环境和业务要求(开发、用户验收测试、预生产或生产),选择 us-east-1 或多个美国东部区域。

  2. 将 Amazon EC2 和 Amazon RDS 实例安排在早上六点到晚上 8 点之间运行(东部标准时间 (EST))。

  3. 八小时后停止所有未使用的亚马逊EC2实例,在闲置 24 小时后停止未使用的亚马逊RDS实例。

  4. 在非生产环境中处于非活动状态 24 小时后,终止所有未使用的 Amazon EC2 实例。提醒亚马逊EC2实例所有者(基于标签)查看其已停止的生产环境中的亚马逊EC2实例,并告知他们,如果不使用他们的亚马逊EC2实例,将在 72 小时内终止。

  5. 使用通用实例系列和大小,例如 m5.large,然后使用基于CPU内存利用率调整实例的大小。 AWS Compute Optimizer

  6. 优先使用自动扩缩,根据流量动态调整运行的实例数量。

  7. 为非关键工作负载使用竞价型实例。

  8. 查看容量需求,为可预测的工作负载使用节省计划或预留实例,并通知云财务管理团队。

  9. 使用 Amazon S3 生命周期策略,将不经常访问的数据移动到更便宜的存储层。如果未定义保留策略,请使用 Amazon S3 Intelligent Tiering,自动将对象移动到存档层。

  10. 使用 Amazon 监控资源利用率并设置警报以触发扩展事件 CloudWatch。

  11. 对于每种预算 AWS 账户,都可以根据成本中心和业务单位为您的账户设置成本和使用量预算。 AWS Budgets

  12. 使用 AWS Budgets 为账户设置成本和使用预算可以帮助您控制支出并避免意外账单,从而更好地控制成本。

程序:提供实施此策略的详细过程,或参考介绍如何实施各个策略声明的其他文档。本节应提供执行政策要求的 step-by-step说明。

要实施此政策,您可以使用各种第三方工具或 AWS Config 规则来检查是否符合政策声明,并使用 AWS Lambda 函数触发自动补救措施。您也可以使用 AWS Organizations 来强制执行策略。此外,您应定期查看资源使用情况,并在必要时调整策略,以确认策略继续满足业务需求。

实施步骤

  • 与利益相关方交流:要制定策略,让组织内的利益相关方(云业务办公室、工程师或实施策略的职能部门决策者)详细说明他们的要求并记录下来。采用迭代方法,首先大致进行,然后在每一步中不断细化到最小单元。团队成员包括与工作负载切身相关的人员(例如组织单位或应用程序负责人)以及支持小组(例如安全和财务团队)。

  • 获得确认:确保团队就哪些人可以访问和部署到 AWS Cloud的策略达成一致。确保这些人遵守组织的策略,并确认其资源创建符合商定的策略和程序。

  • 创建入职培训课程:要求新组织成员完成入职培训课程,以建立成本意识并了解组织要求。他们可能会采取不同于以往经验的策略,或者根本不考虑这些策略。

  • 定义运行工作负载的位置:定义工作负载的运行位置,包括国家/地区以及国家/地区中的区域。此信息用于映射到 AWS 区域 和可用区。

  • 定义服务和资源并对其进行分组:定义工作负载所需的服务。对于每项服务,指定类型、大小和所需资源数量。按职能定义资源组,如应用程序服务器或数据库存储。资源可属于多个组。

  • 定义用户并按职能对其进行分组:定义与工作负载交互的用户,侧重于用户的工作范畴及其使用工作负载的方式,而不是侧重于他们的身份或其在组织中的职位。将类似用户或职能分组在一起。您可以使用 AWS 托管策略作为指导。

  • 定义操作:使用前面确定的位置、资源和用户,定义每项在其生命周期(开发、运行和停用)内实现工作负载成果所需的操作。根据每个位置的组(而不是组中的个别元素)确定操作。首先广泛读写,然后细化到每项服务的具体操作。

  • 定义审核期:工作负载和组织要求可能会随着时间的推移而发生变化。定义工作负载审核计划,确保其与组织优先事项保持一致。

  • 记录策略:确认已定义的策略是否可按组织的要求访问。这些策略用于实施、维护和审核对环境的访问。

资源

相关文档:

相关视频:

相关示例: