HealthOmics 儲存體 - AWS HealthOmics

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

HealthOmics 儲存體

使用 HealthOmics 儲存,以低成本有效率地存放、擷取、整理和共用基因體資料。HealthOmics 儲存體了解不同資料物件之間的關係,因此您可以定義哪些讀取集源自相同的來源資料。這為您提供了資料來源。

儲存為 ACTIVE 狀態的資料可立即擷取。30 天以上未存取的資料會儲存為 ARCHIVE 狀態。若要存取封存的資料,您可以透過 API 操作或主控台重新啟用。

HealthOmics 序列存放區旨在保留檔案的內容完整性。不過,因為在作用中和封存分層期間壓縮,所以不會保留匯入資料檔案和匯出檔案的位元相等性。

在擷取期間,HealthOmics 會產生實體標籤或 HealthOmics ETag,以驗證資料檔案的內容完整性。定序部分會在讀取集的來源層級識別並擷取為 ETag。ETag 計算不會改變實際的檔案或基因體資料。建立讀取集之後,ETag 不應在讀取集來源的整個生命週期中變更。這表示重新匯入相同的檔案會導致計算相同的 ETag 值。