本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
练习运行警报
在分区自动切换中,您可以为练习跑指定两种类型的 CloudWatch 警报:结果警报和阻塞警报。
- 结果警报(必填)
对于第一种类型的警报,即结果警报,至少需要指定一个警报。您应该配置结果警报,以便在每 30 分钟的练习中流量从可用区转移出来时监控应用程序的运行状况。
为了使练习生效,请将至少一个符合以下两个条件的 CloudWatch 警报指定为结果警报:
警报监控资源或您的应用程序的指标
AND
当您的应用程序因失去一个可用区而受到不利影响时,警报会以
ALARM
状态响应。有关更多信息,请参阅 配置区域自动移位时的最佳实践中的为练习运行指定的警报部分。
结果警报还为每次练习跑步提供ARC报告的练习跑结果的信息。如果结果警报进入
ALARM
状态,ARC 将结束练习跑并返回练习跑的结果FAILED
。如果练习跑结束了 30 分钟的测试周期,并且您指定的结果警报均未进入ALARM
状态,则返回的结果为SUCCEEDED
。练习运行结果部分提供了所有结果值的列表及其描述。- 屏蔽警报(可选)
或者,您可以指定第二种警报类型,即屏蔽警报。当一个或多个警报
ALARM
处于状态时,屏蔽警报会阻止练习从启动或继续运行。当至少有一个警报处于状态时,屏蔽警报会阻止练习运行流量从启动开始转移并停止任何正在进行的练习。ALARM
例如,在具有多个微服务的大型架构中,当一个微服务遇到问题时,您通常希望停止应用程序环境中的所有其它更改,其中包括阻止练习运行。您可以在 ARC 中添加阻塞警报来完成此操作。