PERF02-BP05 动态扩展计算资源 - AWS Well-Architected Framework

PERF02-BP05 动态扩展计算资源

利用云的弹性根据需求动态增减计算资源,避免为工作负载预置的容量过多或者不足。

常见反模式:

  • 通过手动增加容量来对警报做出反应。

  • 使用本地所用的规模调整指南(通常是静态基础设施)。

  • 在扩展事件之后,您保留增加的容量,而不是缩减容量。

建立此最佳实践的好处: 配置和测试计算资源的弹性将有助于您节省资金、维护性能基准,以及在流量变化时提高可靠性。

未建立这种最佳实践的情况下暴露的风险等级:

实施指导

AWS 让您能够通过各种扩展机制灵活地动态扩展或缩减资源,以便满足不断变化的需求。动态扩展结合计算相关的指标,可使工作负载自动响应变化,并利用一系列最优的计算资源来实现目标。

您可以使用大量不同方法来实现资源的供需匹配。

  • 目标跟踪方法:监控您的扩展指标,并根据需要自动增加或减少容量。

  • 预测性扩缩:根据每日和每周的趋势进行扩展。

  • 基于计划的方法:根据可预测的负载变化设置自己的扩展计划。

  • 服务扩展:选择可根据设计自动扩展的服务(如无服务器)。

您必须确保工作负载部署可以处理扩展和缩减事件。

实施步骤

  • 计算实例、容器和函数都能够与自动扩展服务相结合或作为此服务的一项功能来提供可实现弹性的机制。以下是自动扩展机制的一些示例:

    自动扩展机制 使用情形
    Amazon EC2 Auto Scaling 确保您拥有适量的 Amazon EC2 实例,可处理您应用程序的用户负载。
    Application Auto Scaling 自动扩缩 Amazon EC2 以外的各项 AWS 服务的资源,比如 AWS Lambda 函数或 Amazon Elastic Container Service(Amazon ECS) 服务。
    Kubernetes Cluster Autoscaler/Karpenter 自动扩缩 Kubernetes 集群。
  • 扩展通常与计算服务(如 Amazon EC2 实例或 AWS Lambda 函数)相关。此外,也请务必考虑非计算服务(如 AWS Glue )的配置来满足需求。

  • 验证扩展指标是否与正在部署的工作负载的特征相匹配。如果您正在部署一个视频转码应用程序,CPU 利用率预计为 100%,并且不应将此作为您的主要指标。改用转码作业队列的深度。如果需要,您可以为您的扩缩策略使用一个 自定义指标 。要选择正确的指标,请考虑以下关于 Amazon EC2 的指导:

    • 该指标应该是有效的利用率指标,并描述实例的繁忙程度。

    • 该指标值必须随 Auto Scaling 组中的实例数量成比例地增加或减少。

  • 确保使用 动态扩展 而不是 手动扩展 (对于 Auto Scaling 组)。我们还建议您在动态扩展中使用 目标跟踪扩缩策略

  • 验证工作负载部署是否能够同时处理扩展事件和缩减事件。例如,您可以使用 活动历史记录 来验证 Auto Scaling 组的扩缩活动。

  • 评估您的工作负载以获得可预测的模式,并在您预期需求会发生预测和计划的变化时主动扩缩。借助预测性扩缩,您无需过度调配容量。有关更多详细信息,请参阅 Amazon EC2 Auto Scaling 预测性扩缩

资源

相关文档:

相关视频:

相关示例: