使用 S3 Glacier 存储类作为长期数据存储 - Amazon Simple Storage Service

使用 S3 Glacier 存储类作为长期数据存储

Amazon S3 提供多个 S3 Glacier 存储类,旨在提供经济实惠的解决方案,用来存储不经常访问的长期数据。S3 Glacier 存储类为:

  • S3 Glacier Instant Retrieval

  • S3 Glacier Flexible Retrieval

  • S3 Glacier Deep Archive

您可以根据访问数据的频率和需要检索数据的速度来选择其中一个存储类。这些存储类中的每一个都提供与 S3 Standard 存储类相同的持久性和弹性,但存储成本较低。有关 S3 Glacier 存储类的更多信息,请参阅 https://aws.amazon.com/s3/storage-classes/glacier/

比较 S3 Glacier 存储类

每个 S3 Glacier 存储类对于所有对象都有最短存储持续时间。如果您在最短存储持续时间之前删除、覆盖对象或将其转换为不同的存储类,则您需要按完整的最短存储持续时间付费。

有些 S3 Glacier 存储类用于归档目的,这意味着存储在这些存储类中的对象已归档,不可用于实时访问。有关更多信息,请参阅 归档存储

专为不太频繁访问模式和较长检索时间而设计的存储类可提供较低的存储成本。有关定价信息,请参阅 https://aws.amazon.com/s3/pricing/

下表汇总了选择 S3 Glacier 存储类时要考虑的要点:

S3 Glacier 存储类 最小存储持续时间 建议的访问频率 平均检索时间 是否为归档?
S3 Glacier Instant Retrieval 90 天 每季度 毫秒
S3 Glacier Flexible Retrieval 90 天 每半年 分钟至 12 小时
S3 Glacier Deep Archive 180 天 每年 9 至 48 小时

S3 Glacier Instant Retrieval

对于每季度访问一次且需要毫秒级检索时间的长期数据,我们建议使用 S3 Glacier Instant Retrieval。这种存储类非常适合注重性能的使用案例,例如图像托管、文件共享应用程序以及存储医疗记录以供在预约期间访问。

S3 Glacier Instant Retrieval 存储类提供实时访问对象的能力,具有与 S3 Standard-IA 存储类相同的延迟和吞吐量性能。与 S3 Standard-IA 相比,S3 Glacier Instant Retrieval 的存储成本更低,但数据访问成本更高。

存储在 S3 Glacier Instant Retrieval 存储类中的数据对象大小最低为 128 KB。此存储类还具有 90 天的最短存储持续时间。

S3 Glacier Flexible Retrieval

对于每年访问一到两次且不需要立即访问的归档数据,我们建议使用 S3 Glacier Flexible Retrieval。S3 Glacier Flexible Retrieval 提供灵活的检索时间,有助于您平衡成本,访问时间从几分钟到几小时不等,并且可以免费批量检索。此存储类非常适合备份和灾难恢复。

存储在 S3 Glacier Flexible Retrieval 中的对象已归档,无法实时访问。有关更多信息,请参阅 归档存储。要访问这些对象,首先启动还原请求,该请求会创建对象的临时副本,您可以在请求完成时访问该副本。有关信息,请参阅使用归档的对象。当您还原对象时,您可以选择一个检索层来满足您的使用案例,还原时间越长,成本越低。

以下检索层适用于 S3 Glacier Flexible Retrieval:

  • 加速检索 - 通常在 1-5 分钟内还原对象。加速检索视需求而定,因此,为了确保您拥有可靠且可预测的还原时间,建议您购买预置检索容量。有关更多信息,请参阅 预调配容量

  • 标准检索 - 通常在 3-5 小时内还原对象,或者当使用 S3 批量操作时,在 1 分钟到 5 小时内还原对象。有关更多信息,请参阅 使用批量操作还原对象

  • 批量检索 - 通常在 5 到 12 小时内还原对象。批量检索是免费的。

S3 Glacier Flexible Retrieval 存储类中对象的最短存储持续时间为 90 天。

S3 Glacier Flexible Retrieval 对于每个对象需要 40 KB 的额外元数据。这包括识别和检索您的数据所需的 32 KB 元数据,按 S3 Glacier Flexible Retrieval 的默认费率计费。需要额外 8 KB 数据来维护归档对象的用户定义名称和元数据,按 S3 Standard 费率计费。

S3 Glacier Deep Archive

对于每年访问不到一次的归档数据,我们建议使用 S3 Glacier Deep Archive。此存储类专为将数据集保留多年来满足合规性要求而设计,也可用于备份或灾难恢复,或任何不频繁访问的数据,您可能要等待多达 72 小时才能检索这些数据。S3 Glacier Deep Archive 是 AWS 中成本最低的存储选项。

存储在 S3 Glacier Deep Archive 中的对象已归档,无法实时访问。有关更多信息,请参阅 归档存储。要访问这些对象,首先启动还原请求,该请求会创建对象的临时副本,您可以在请求完成时访问该副本。有关信息,请参阅使用归档的对象。当您还原对象时,您可以选择一个检索层来满足您的使用案例,还原时间越长,成本越低。

以下检索层适用 S3 Glacier Deep Archive:

  • 标准检索 - 通常在 12 小时内还原对象,或者当使用 S3 批量操作时,在 9–12 小时内还原对象。有关更多信息,请参阅 使用批量操作还原对象

  • 批量检索 - 通常在 48 小时内还原对象,成本仅为标准检索层的一小部分。

S3 Glacier Deep Archive 存储类中对象的最短存储持续时间为 180 天。

S3 Glacier Deep Archive 对于每个对象需要 40 KB 的额外元数据。这包括识别和检索您的数据所需的 32 KB 元数据,按 S3 Glacier Deep Archive 的默认费率计费。需要额外 8 KB 数据来维护归档对象的用户定义名称和元数据,按 S3 Standard 费率计费。

归档存储

S3 Glacier Flexible Retrieval 和 S3 Glacier Deep Archive 为归档存储类。这意味着,当您将对象存储在这些存储类中时,该对象将归档,无法直接访问。要访问已归档的对象,您需要为其提交还原请求,然后等待服务还原该对象。还原请求会还原对象的临时副本,并且在超过您在请求中指定的持续时间之后,删除该副本。有关更多信息,请参阅使用归档的对象

这些存储类对于每个归档对象都需要 40 KB 的额外元数据。这包括识别和检索数据所需的 32 KB 元数据,按该存储类的默认费率计费。需要额外 8 KB 数据来维护归档对象的用户定义名称和元数据,按 S3 Standard 费率计费。

当使用分段上传来上传这些存储类中的对象时,将按照 S3 Standard 存储类费率计费。有关更多信息,请参阅 分段上传和定价

对于每个账户中的每个 AWS 区域,在还原这些存储类中的对象时,处理对象还原请求数的速度可高达每秒 1000 个事务(TPS,Transactions Per Second)。

这些存储类与 S3 Glacier 服务有何不同

S3 Glacier 存储类是 Amazon S3 服务的一部分,将数据作为对象存储在 S3 存储桶中。您可以使用 S3 控制台,或使用 S3 API 或 SDK 以编程方式,来管理这些存储类中的对象。当您将对象存储在 S3 Glacier 存储类中时,您可以使用高级加密、对象标记和 S3 生命周期配置等 S3 功能,来协助管理数据可访问性和成本。

重要

我们建议使用 Amazon S3 服务中的 S3 Glacier 存储类来存储所有长期数据。

Amazon S3 Glacier(S3 Glacier)服务是一项单独的服务,它将数据作为归档存储在保管库中。此服务不支持 Amazon S3 功能,也不为数据上传和下载操作提供控制台支持。我们建议不要使用 S3 Glacier 服务来存储您的长期数据。存储在 S3 Glacier 服务中的数据无法通过 Amazon S3 服务访问。如果您正在寻找有关 S3 Glacier 服务的信息,请参阅 Amazon S3 Glacier Developer Guide。要将数据从 Amazon S3 Glacier 服务传输到 Amazon S3 中的存储类,请参阅 AWS 解决方案库中的将数据从 Amazon S3 Glacier 保管库传输到 Amazon S3