云中的灾难恢复有所不同 - AWS 上的工作负载灾难恢复:云中的恢复

云中的灾难恢复有所不同

灾难恢复策略随着技术创新而发展。本地灾难恢复计划可能涉及以物理方式运输磁带或将数据复制到另一站点。您的企业需要重新评估其之前灾难恢复策略的业务影响、风险和成本,以实现其在 AWS 上的灾难恢复目标。与传统环境相比,AWS 云中的灾难恢复具有以下优势:

  • 迅速从灾难中恢复,并降低复杂性

  • 简单且可重复的测试使您可以更轻松、更频繁地进行测试

  • 更低的管理开销减轻了运营负担

  • 实施自动化的机会减少了出错的几率并缩短了恢复时间

采用 AWS,您将告别物理备份数据中心的固定资本支出,转而为云中规模合适的环境支付可变营运支出,这样可以显著降低成本。

对于许多企业而言,本地灾难恢复的设计围绕着数据中心内一个或多个工作负载中断的风险,以及将备份或复制的数据恢复到辅助数据中心。当企业在 AWS 上部署工作负载时,他们可以实施架构完善的工作负载,并依靠 AWS 全球云基础设施的设计来帮助减轻此类中断的影响。有关在云中设计和运行可靠、安全、高效且具有成本效益的工作负载的架构最佳实践的更多信息,请参阅《AWS Well-Architected Framework – 可靠性支柱》白皮书

如果您的工作负载在 AWS 上,则无需担心数据中心的连接(访问能力除外)、电力、空调、消防和硬件。所有这些均为您托管,并且您可以访问多个故障隔离可用区(每个可用区由一个或多个分立的数据中心组成)。

单个 AWS 区域

对于因一个物理数据中心中断或丢失而导致的灾难事件,在单个 AWS 区域内的多个可用区实施高可用性工作负载有助于缓解自然灾害和技术灾难,并降低人为威胁(例如可能导致数据丢失的错误或未经授权的活动)的风险。每个 AWS 区域都由多个可用区组成,每个可用区与其他可用区之间实现故障隔离。每个可用区又由多个物理数据中心组成。为了更好地隔离影响较大的问题并实现高可用性,您可以跨同一区域中的多个可用区对工作负载进行分区。可用区专为实现物理冗余而设计,具有弹性,即使在出现断电、互联网停机、洪水和其他自然灾害的情况下也能实现不间断的性能。请参阅 AWS 全球云基础设施,了解 AWS 如何做到这一点。

通过跨单个 AWS 区域中的多个可用区进行部署,可以更好地保护您的工作负载免受单个(甚至多个)数据中心故障的影响。为了对您的单区域部署提供额外的保障,您可以将数据和配置(包括基础设施定义)备份到另一个区域。此策略将灾难恢复计划的范围缩小到仅包括数据备份和还原。与下一节所述的其他多区域选项相比,通过备份到另一个 AWS 区域来利用多区域弹性既简单又便宜。例如,通过备份到 Amazon Simple Storage Service(Amazon S3),您可以立即检索数据。但是,如果您针对部分数据的灾难恢复策略对检索时间的要求更宽松(从几分钟到几小时),那么使用 Amazon S3 Glacier 或 Amazon S3 Glacier Deep Archive 将显著降低备份和恢复策略的成本。

某些工作负载可能有监管数据驻留要求。如果您的工作负载属此情况,且其所在地点当前只有一个 AWS 区域,那么除了按照上述介绍,设计多可用区工作负载以实现高可用性之外,您还可以将该区域中的多个可用区用作分立位置,这有助于满足适用于该区域中工作负载的数据驻留要求。以下各节所述的灾难恢复策略使用多个 AWS 区域,但也可以使用多个可用区而不是区域来实施这些策略。

多个 AWS 区域

如果灾难事件涉及相距甚远的多个数据中心。且这些数据中心有丢失的风险,则您应该考虑使用能够缓解影响 AWS 中整个区域的自然灾害和技术灾难的灾难恢复选项。以下各节所述的所有选项均可作为多区域架构来实施,以防范此类灾难。