本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
HealthOmics 存储
使用 HealthOmics 存储以低成本高效地存储、检索、组织和共享基因组学数据。 HealthOmics 存储了解不同数据对象之间的关系,因此您可以定义哪些读取集源自相同的源数据。这为您提供了数据来源。
存储在ACTIVE
状态下的数据可以立即检索。30 天或更长时间未被访问的数据将以ARCHIVE
状态存储。要访问存档的数据,您可以通过 API 操作或控制台将其重新激活。
HealthOmics 序列存储旨在保持文件的内容完整性。但是,由于在活动分层和存档分层期间会进行压缩,因此无法保留导入数据文件和导出文件的按位等效性。
在摄取期间, HealthOmics 生成实体标签 HealthOmics ETag,或,以便验证数据文件的内容完整性。测序部分在读取集的 ETag 源级别被识别和捕获。 ETag 计算结果不会改变实际文件或基因组数据。创建读取集后,在读取集源的整个生命周期中 ETag 不应发生变化。这意味着重新导入相同的文件会导致计算出相同的 ETag 值。