本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
AWS Resilience Hub — 弹性管理
AWS Resilience Hub 为您提供了一个定义、验证和跟踪 AWS 应用程序弹性的中心位置。 AWS Resilience Hub 帮助您保护应用程序免受中断,并降低恢复成本以优化业务连续性,从而帮助满足合规性和监管要求。您可以使用 AWS Resilience Hub 执行以下操作:
-
分析您的基础架构并获取建议,以提高应用程序的弹性。除了用于提高应用程序弹性的架构指南外,这些建议还提供了满足弹性策略、实施测试、警报和标准操作程序 (SOPs) 的代码,您可以在集成和交付 (CI/CD) 管道中与应用程序一起部署和运行这些代码。
-
评估不同条件下的恢复时间目标 (RTO) 和恢复点目标 (RPO) 目标。
-
优化业务连续性,同时降低恢复成本。
-
在生产中出现问题之前识别并解决问题。
将应用程序部署到生产环境后,您可以添加 AWS Resilience Hub 到 CI/CD 管道中,以便在每个版本发布到生产环境之前对其进行验证。
如何 AWS Resilience Hub 运作
下图简要概述了 AWS Resilience Hub 工作原理。
- 描述
-
通过从 AWS CloudFormation 堆栈、Terraform 状态文件、Amazon Elastic Kubernetes Service 集群中导入资源来描述您的应用程序,或者您可以从中已经定义的应用程序中进行选择。 AWS Resource Groups myApplications
- 定义
-
为您的应用程序定义弹性策略。这些政策包括RTO应用程序、基础设施、可用区和区域中断的RPO目标。这些目标用于估计应用程序是否符合弹性策略。
- 评测
-
描述您的应用程序并向其附加弹性策略后,运行弹性评测。该 AWS Resilience Hub 评估使用 Well-Architect AWS ed Framework 中的最佳实践来分析应用程序的组件并发现潜在的弹性弱点。这些漏洞可能由于基础设施设置不完整、配置错误或需要进一步改进配置的情况造成。要提高弹性,请根据评测报告中的建议更新您的应用程序和弹性策略。建议包括组件、警报、测试和恢复的配置SOPs。然后,您可以再进行一次评测,并将结果与之前的报告进行比较,以了解弹性在多大程度上得到了改善。重复此过程,直到您的估计工作量RTO和估计的工作量RPO达到您的RTO和RPO目标。
- 验证
-
运行测试以衡量 AWS 资源的弹性以及从应用程序、基础架构、可用区和 AWS 区域 事件中恢复所需的时间。为了衡量弹性,这些测试会模拟您的 AWS 资源中断情况。中断的示例包括网络不可用错误、故障转移、进程停止、Amazon RDS 启动恢复以及可用区问题。
- 查看和追踪
-
将 AWS 应用程序部署到生产环境后,您可以使用 AWS Resilience Hub 继续跟踪应用程序的弹性状况。如果发生中断,操作员可以查看中断情况 AWS Resilience Hub 并启动相关的恢复过程。