REL01-BP04 监控和管理配额 - 可靠性支柱

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

REL01-BP04 监控和管理配额

评估可能的使用情况,并适当提高配额,支持使用量按计划增长。

期望结果:部署了可进行管理和监控的主动和自动化系统。这些操作解决方案可确保接近达到配额使用阈值。根据请求的配额更改主动修复这些问题。

常见反模式:

  • 没有配置监控来检查服务配额阈值。

  • 没有为硬限制配置监控,即使这些值不能更改。

  • 假定请求和确立软配额变化所需的时间是即时或短时间。

  • 配置警报在快达到服务配额时发出警报,但没有关于如何对警报做出响应的流程。

  • 仅为 Service Quota AWS s 支持的服务配置警报,不监控其他 AWS 服务。

  • 不考虑多区域韧性设计(如“主动/主动”、“主动/被动 – 热”、“主动/被动 – 冷”和“主动/被动 – 指示灯”方法)的配额管理。

  • 不评测区域之间的配额差异。

  • 不评测每个区域对特定配额提高请求的需求。

  • 不利用模板进行多区域配额管理

建立此最佳实践的好处:自动跟踪 S AWS ervice Quotas 并根据这些配额监控您的使用情况,这样您就可以看到何时接近配额限制。您还可以使用此监控数据帮助限制由于配额耗尽而导致的性能下降。

在未建立这种最佳实践的情况下暴露的风险等级:

实施指导

对于支持的服务,您可以配置各种能进行评测的不同服务,再通过发送提醒或警报来监控配额。这有助于监控使用情况,并可在接近配额时发出提醒。这些警报可以从 Lambda 函数 AWS Config、Ama CloudWatch zon 或从中调用。 AWS Trusted Advisor您还可以使用 CloudWatch 日志上的指标筛选器来搜索和提取日志中的模式,以确定使用量是否接近配额阈值。

实施步骤

监控:

  • 获取当前资源使用情况(例如存储桶或实例)。使用服务API操作(例如 Amazon EC2 DescribeInstancesAPI)来收集当前的资源消耗。

  • 使用以下资源获得必要且适用于服务的当前配额:

    • AWS 服务配额

    • AWS Trusted Advisor

    • AWS 文档

    • AWS 特定于服务的页面

    • AWS Command Line Interface (AWS CLI)

    • AWS Cloud Development Kit (AWS CDK)

  • 使用 S AWS ervice Quotas,该 AWS 服务可帮助您从一个位置管理 250 多项 AWS 服务的配额。

  • 使用 Trusted Advisor 服务限制来监控当前处于不同阈值的服务限制。

  • 使用服务配额历史记录(控制台或 AWS CLI)查看区域配额增长情况。

  • 如果需要,比较每个区域和每个账户中的服务配额变化,形成等效关系。

管理:

  • 自动:设置 AWS Config 自定义规则以扫描各区域的服务配额并比较差异。

  • 自动:设置计划好的 Lambda 函数以扫描各个区域的服务配额,并比较它们之间的差异。

  • 手动:通过 AWS CLI API、或 AWS 控制台扫描服务配额以扫描各区域的服务配额并比较差异。报告差异。

  • 如果在不同区域之间发现配额差异,则根据需要请求更改配额。

  • 检查所有请求的结果。

资源

相关最佳实践:

相关文档:

相关视频:

相关工具: