REL01-BP04 监控和管理限额 - AWS Well-Architected Framework

REL01-BP04 监控和管理限额

评估您的可能使用情况,并适当提高您的限额,支持使用量按计划增长。

期望结果:部署了可进行管理和监控的主动和自动化系统。这些操作解决方案可确保接近达到限额使用阈值。根据请求的限额更改主动修复这些问题。

常见反模式:

  • 未配置监控以检查服务限额阈值

  • 没有为硬限制配置监控,即使这些值不能更改。

  • 假定请求和确立软限额变化所需的时间是即时或短时间。

  • 配置警报,以在快达到服务限额时发出警报,但没有关于如何对提醒做出响应的流程。

  • 只为 AWS Service Quotas 支持的服务配置警报,不监控其他 AWS 服务。

  • 不考虑多区域弹性设计(如“主动/主动”、“主动/被动 – 热”、“主动/被动 - 冷”和“主动/被动 - 指示灯”方法)的限额管理。

  • 不评估区域之间的限额差异。

  • 不评估每个区域对特定限额增加请求的需求。

  • 不利用模板进行多区域限额管理

建立此最佳实践的好处:自动跟踪 AWS Service Quotas,并根据这些限额监控您的使用情况,使您可以了解何时达到限额。您还可以使用此监控数据帮助限制由于限额耗尽而导致的降级。

在未建立这种最佳实践的情况下暴露的风险等级:中等

实施指导

对于支持的服务,您可以通过配置各种可以进行评测的不同服务,然后发送警报,从而监控限额。这有助于监控使用情况,并可在接近限额时提醒您。这些警报可以从 AWS Config、Lambda 函数、Amazon CloudWatch 或从 AWS Trusted Advisor 触发。您还可以使用 CloudWatch Logs 上的指标筛选条件来搜索与提取日志中的模式,确定使用量是否快达到限额阈值。

实施步骤

对于监控:

  • 获取当前资源使用量(例如存储桶或实例)。使用服务 API 操作(例如 Amazon EC2 DescribeInstances API)来收集当前资源使用量。

  • 使用以下项获得必要且适用于服务的当前限额:

    • AWS Service Quotas

    • AWS Trusted Advisor

    • AWS 文档

    • AWS 服务特定页面

    • AWS Command Line Interface(AWS CLI)

    • AWS Cloud Development Kit (AWS CDK)

  • AWS Service Quotas 是一项 AWS 服务,使用该服务可帮助您在一个地方管理超过 250 项 AWS 服务的限额。

  • 使用 Trusted Advisor 服务限制来监控在各种阈值下的当前服务限制。

  • 使用服务限额历史记录(控制台或 AWS CLI)来检查区域增长情况。

  • 如果需要,比较每个区域和每个账户中的服务限额变化,以形成等效性。

对于管理:

  • 自动:设置 AWS Config 自定义规则以扫描各个区域的服务限额,并比较它们之间的差异。

  • 自动:设置计划好的 Lambda 函数以扫描各个区域的服务限额,并比较它们之间的差异。

  • 手动:通过 AWS CLI、API 或 AWS 控制台来扫描各个区域的服务限额,并比较它们之间的差异。报告差异。

  • 如果在不同区域之间发现限额差异,如有需要,请求限额更改。

  • 检查所有请求的结果。

资源

相关最佳实践:

相关文档:

相关视频:

相关工具: