COST09-BP02 实施缓冲区或节流来管理需求 - 成本优化支柱

COST09-BP02 实施缓冲区或节流来管理需求

缓冲区和节流可修改工作负载需求,从而避免出现任何峰值情形。在客户端执行重试时实施节流。实施缓冲以存储请求并将处理任务往后推迟一段时间。确认设计节流和缓冲区时客户端能够在所需的时间内收到响应。

在未建立这种最佳实践的情况下暴露的风险等级:中等

实施指导

在云计算领域,实施缓冲区或节流对于管理需求和减少工作负载所需的预置容量至关重要。为了获得最佳性能,必须衡量总需求,包括峰值、请求变化的速度和必需的响应时间。当客户端能够重新发送请求时,应用节流比较切实可行。相反,对于缺乏重试功能的客户端,理想的方法是实施缓冲区解决方案。此类缓冲区可舒缓请求的涌入,并优化具有不同操作速度的应用程序之间的交互。

Demand curve with two distinct peaks that require high provisioned capacity

需求曲线具有两个不同的峰值,需要高预置容量

假设工作负载的需求曲线如上图所示。此工作负载有两个峰值,为了处理这些峰值,如橙色线所示预置资源容量。因为需要预置容量来处理这两个峰值,所以此工作负载所使用的资源和能源不是由需求曲线下的区域表示,而是由预置容量线下面的区域表示。展平工作负载需求曲线有助于降低工作负载的预置容量和减少对环境的影响。为了平滑峰值,可以考虑实施节流或缓冲解决方案。

为了更好地理解它们,让我们探讨一下节流和缓冲。

节流:如果需求源具有重试功能,可以实施节流。节流会告诉需求源,如果当前无法处理请求,则应稍后再试。源将等待一段时间,然后重试请求。实施节流的优势是可限制最大资源量和工作负载成本。在 AWS 中,您可以使用 Amazon API Gateway 来实施节流。

基于缓冲区:基于缓冲区的方法使用产生器(向队列发送消息的组件)、使用器(从队列接收消息的组件)和队列(保存消息)来存储消息。然后消息将由使用器读取并处理,这样消息就能够以满足使用器业务需求的速率运行。通过使用以缓冲区为中心的方法,产生器发出的消息被存储在队列或流中,随时可供使用器以符合其运营需求的速度进行访问。

在 AWS 中,您可以从多个服务中进行选择来实施缓冲方法。Amazon Simple Queue Service(Amazon SQS)是一项托管服务,它提供队列,允许单个使用器读取单个消息。Amazon Kinesis 提供了一个允许许多使用器读取相同消息的流。

缓冲和节流可以通过修改工作负载需求来平滑任何峰值。在客户端重试操作时使用节流,并使用缓冲来保存请求以供以后处理。使用基于缓冲区的方法时,请构造工作负载以在所需时间内处理请求,并验证您是否能够处理重复的工作请求。分析总体需求、变化率和所需的响应时间,以使所需节流或缓冲的大小适宜。

实施步骤

  • 分析客户端需求:分析客户端请求以确定它们是否能够重试。对于无法执行重试的客户端,需要实施缓冲区。分析总体需求、变化率和所需的响应时间,以确定所需的节流或缓冲区大小。

  • 实施缓冲区或节流:在工作负载中实施缓冲区或节流。Amazon Simple Queue Service(Amazon SQS)之类的队列可以为工作负载组件提供缓冲区。Amazon API Gateway 可以为工作负载组件提供节流。

资源

相关最佳实践:

相关文档:

相关视频:

相关示例: