REL01-BP04 监控和管理配额 - 可靠性支柱

REL01-BP04 监控和管理配额

评估可能的使用情况,并适当提高配额,支持使用量按计划增长。

期望结果:部署了可进行管理和监控的主动和自动化系统。这些操作解决方案可确保接近达到配额使用阈值。根据请求的配额更改主动修复这些问题。

常见反模式:

  • 没有配置监控来检查服务配额阈值。

  • 没有为硬限制配置监控,即使这些值不能更改。

  • 假定请求和确立软配额变化所需的时间是即时或短时间。

  • 配置警报在快达到服务配额时发出警报,但没有关于如何对警报做出响应的流程。

  • 只为 AWS 服务配额支持的服务配置警报,不监控其他 AWS 服务。

  • 不考虑多区域韧性设计(如“主动/主动”、“主动/被动 – 热”、“主动/被动 – 冷”和“主动/被动 – 指示灯”方法)的配额管理。

  • 不评测区域之间的配额差异。

  • 不评测每个区域对特定配额提高请求的需求。

  • 不利用模板进行多区域配额管理

建立此最佳实践的好处:自动跟踪 AWS 服务配额,并根据这些配额监控使用情况,以便了解何时会达到配额限制。您还可以使用此监控数据帮助限制由于配额耗尽而导致的性能下降。

在未建立这种最佳实践的情况下暴露的风险等级:

实施指导

对于支持的服务,您可以配置各种能进行评测的不同服务,再通过发送提醒或警报来监控配额。这有助于监控使用情况,并可在接近配额时发出提醒。这些警报可以从 AWS Config、Lambda 函数、Amazon CloudWatch 或 AWS Trusted Advisor 调用。您还可以使用 CloudWatch Logs 上的指标筛选条件来搜索与提取日志中的模式,确定使用量是否快达到配额阈值。

实施步骤

监控:

  • 获取当前资源使用情况(例如存储桶或实例)。使用 Amazon EC2 DescribeInstances API 等服务 API 操作来收集当前资源使用情况信息。

  • 使用以下资源获得必要且适用于服务的当前配额:

    • AWS 服务限额

    • AWS Trusted Advisor

    • AWS 文档

    • AWS 服务特定页面

    • AWS Command Line Interface (AWS CLI)

    • AWS Cloud Development Kit (AWS CDK)

  • 使用 AWS 服务配额(一项 AWS 服务),帮助您从一个地方管理超过 250 项 AWS 服务的配额。

  • 使用 Trusted Advisor 服务限制来监控在各种阈值下的当前服务限制。

  • 使用服务配额历史记录(控制台或 AWS CLI)来检查区域增长情况。

  • 如果需要,比较每个区域和每个账户中的服务配额变化,形成等效关系。

管理:

  • 自动:设置 AWS Config 自定义规则以扫描各个区域的服务配额,并比较它们之间的差异。

  • 自动:设置计划好的 Lambda 函数以扫描各个区域的服务配额,并比较它们之间的差异。

  • 手动:通过 AWS CLI、API 或 AWS 控制台来扫描各个区域的服务配额,并比较它们之间的差异。报告差异。

  • 如果在不同区域之间发现配额差异,则根据需要请求更改配额。

  • 检查所有请求的结果。

资源

相关最佳实践:

相关文档:

相关视频:

相关工具: