REL09-BP01 识别并备份所有需要备份的数据,或从源中复制数据 - 可靠性支柱

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

REL09-BP01 识别并备份所有需要备份的数据,或从源中复制数据

了解并使用工作负载所用的数据服务和资源的备份功能。大多数服务提供了备份工作负载数据的功能。

期望结果:数据来源已确定,并根据重要性进行了分类。然后,根据制定数据恢复策略RPO。此策略涉及到备份这些数据来源,或者能够从其他来源复制数据。在数据丢失的情况下,所实施的策略允许在定义RPO的范围内恢复或复制数据RTO。

云成熟度阶段:基础

常见反模式:

  • 不了解工作负载的所有数据来源及其重要性。

  • 没有对关键数据来源进行备份。

  • 仅对部分数据来源进行备份,但没有考虑重要性标准。

  • 未定义RPO,或者备份频率无法满足RPO。

  • 没有评估备份是否必需或者是否可以从其他来源复制数据。

建立此最佳实践的好处:确定需要备份的位置并实施某种机制来创建备份,或者具备从外部来源复制数据的能力,这样可以提高在停机期间还原和恢复数据的能力。

在未建立这种最佳实践的情况下暴露的风险等级:

实施指导

所有 AWS 数据存储都提供备份功能。诸如Amazon RDS 和Amazon DynamoDB之类的服务还支持自动备份,该备份允许您恢复到当前时间之前最多五分钟或更短的时间内的任何时间。 point-in-time PITR许多 AWS 服务都提供了将备份复制到其他服务的功能 AWS 区域。 AWS Backup 是一款使您能够跨 AWS 服务集中和自动执行数据保护的工具。 AWS Elastic Disaster Recovery允许您从本地、跨可用区或跨区域复制完整的服务器工作负载并保持持续的数据保护,恢复点目标 (RPO) 以秒为单位。

Amazon S3 可用作自我管理和托 AWS管数据源的备份目标。 AWS 亚马逊EBS、亚马逊和亚马逊 RDS DynamoDB 等服务都内置了创建备份的功能。此外,也可使用第三方备份软件。

可以将本地数据备份到 AWS Cloud 使用AWS Storage GatewayAWS DataSync。Amazon S3 存储桶可用于在 AWS中存储此数据。Amazon S3 提供多个存储层(例如 Amazon S3 Glacier 或 S3 Glacier Deep Archive),可用于降低数据存储的成本。

您可以从其他来源复制数据,以此来满足数据恢复需求。例如,如果主节点丢失,可以使用 Amazon 副本节点或 Amazon 只RDS读副本来重现数据。 ElastiCache 如果此类源可以用来满足您的恢复点目标 (RPO) 和恢复时间目标 (RTO),则可能不需要备份。再举一个例子,如果与亚马逊合作EMR,则可能没有必要备份您的HDFS数据存储,只要您可以将数据EMR从Amazon S3复制到亚马逊即可。

在选择备份策略时,请考虑恢复数据所用的时间。恢复数据所需的时间取决于备份的类型(在采用备份策略时)或数据复制机制的复杂性。这段时间应该在工作RTO量范围内。

实施步骤

  1. 确定工作负载的所有数据来源。数据可以存储在多种资源中,例如数据库文件系统日志记录系统对象存储。请参阅 “资源” 部分,查找有关存储数据的不同 AWS 服务以及这些服务提供的备份功能的相关文档

  2. 根据重要性对数据来源进行分类。对于工作负载,不同数据集具有不同的重要程度,因此对韧性具有不同的要求。例如,有些数据可能很重要,需要RPO接近零,而另一些数据可能不那么重要,可以容忍更高的数据丢失RPO和一些数据丢失。同样,不同的数据集也可能有不同的RTO要求。

  3. 使用 AWS 或第三方服务创建数据备份AWS Backup是一项托管服务,允许在上创建各种数据源的备份 AWS。 AWS Elastic Disaster Recovery可自动将亚秒级的数据复制到. AWS 区域大多数 AWS 服务还具有创建备份的本机功能。 AWS Marketplace 还有许多解决方案可以提供这些功能。请参阅下面所列的资源,了解有关如何从不同 AWS 服务创建数据备份的信息。

  4. 为没有备份的数据建立数据复制机制。您可能会出于各种原因,不对可从其他来源复制的数据进行备份。您可能会遇到一种情况,在需要时从来源复制数据的成本相比创建备份更低,因为可能会有与存储备份相关的成本。另一个例子是,从备份中恢复所需的时间比从源中复制数据的时间更长,从而导致数据泄露。RTO在此类情况下请做出权衡,并建立明确定义的流程,确定在需要进行恢复时如何从这些来源复制数据。例如,如果您已将数据从 Amazon S3 加载到数据仓库(如 Amazon RedshiftEMR)或 MapReduce 集群(如 Amazon)以对该数据进行分析,则这可能是可以从其他来源复制的数据的示例。只要这些分析的结果要么存储在某个地方,要么可以复制,就不会因为数据仓库或集群的故障而丢失数据。 MapReduce 其他可以从来源复制的示例包括缓存(如 Amazon ElastiCache)或只RDS读副本。

  5. 制定备份数据的频率。创建数据源备份是一个周期性的过程,频率应取决于RPO。

实施计划的工作量级别:

资源

相关最佳实践:

REL13-BP01 定义停机和数据丢失的恢复目标

REL13-BP02 使用定义的恢复策略来实现恢复目标

相关文档:

相关视频:

相关示例: