本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
自动化 DR 策略
您可以选择实现完全或部分自动化,以更好地控制灾难恢复。如果您使用的是备份和还原 DR 选项,则可以使用 AWS Backup
灾难事件检测
为了缩短恢复时间,您可以考虑自动检测区域范围的事件,然后就能启用至 DR 区域的失效转移。要实施自动检测以实现更积极的 RTO,您可以根据运行状况检查
失效转移
无论您选择哪种 DR 策略,您都可以构建自定义 DR 自动化解决方案,来执行至 DR 区域的失效转移。这种自动化可以最大限度地减少对手动干预的需求,并在测试 DR 解决方案时提供更好的控制。您可以根据组织的偏好从该AWS 服务
出于 DR 的需要,我们建议您专注于以下两个目标:
-
现有CloudFormation 堆栈应导出有关您的数据库的相关信息,包括实例名称和终端节点。您的自动化流程可以参考区域内的这些导出值,并执行有助于 DR 操作的操作。
-
如果您的资源已投入生产但没有关联 CloudFormation堆栈,则应专注于为这些资源创建堆栈。还要确保这些堆栈覆盖正确的导出值,如前面所述。
当你实现了这两个目标后,你可以用组织选择的语言构建自动化解决方案,以利用 CloudFormation 导出的优势,并在发生灾难时自动执行所需的切换操作。例如,如果您有一个 ElastiCache (Redis OSS)全球数据存储作为 CloudFormation 模板部署,则自动化代码可以访问提供有关全局数据存储详细信息的 CloudFormation 导出。发生灾难时,代码可以使用 ElastiCache (Redis OSS) 服务自动将辅助数据存储升级为主数据存储,而无需任何手动干预。 APIs
在一般场景中,自动化应当可以针对组织内的多个数据库进行扩展。您可以使用 AWS Step Functions 或 AWS Batch 扩展多个数据库的自动化解决方案。