本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
光澤資料壓縮
您可以使用 Lustre 資料壓縮功能,在適用於 Lustre 檔案系統和備份儲存的高效能 Amazon FSx 上節省成本。啟用資料壓縮後,Amazon FSx for Lustre 會在新寫入的檔案寫入磁碟之前自動壓縮這些檔案,並在讀取檔案時自動解壓縮這些檔案。
資料壓縮使用 LZ4 演算法,此演算法經過最佳化,可提供高階壓縮,而不會對檔案系統效能造成負面影響。LZ4 是 Lustre 社群信任且以效能為導向的演算法,可在壓縮速度和壓縮檔案大小之間取得平衡。啟用資料壓縮通常不會對延遲產生可衡量的影響。
資料壓縮可減少適用於 Lustre 檔案伺服器和儲存的 Amazon FSx 之間傳輸的資料量。如果您尚未使用壓縮檔案格式,在使用資料壓縮時,您會看到整體檔案系統輸送量容量有所增加。在您飽和前端網路介面卡之後,與資料壓縮相關的輸送量容量增加將會受到上限。
例如,如果您的檔案系統是 PERSISTENT-50 SSD 部署類型,則網路輸送量的基準為每 TiB 每秒 250 MB/s 的儲存體。您的磁碟輸送量基準為每 TiB 50 MB/s。透過資料壓縮,您的磁碟輸送量可能會從每 TiB 50 MB/s 增加到每 TiB 的最大 250 MB/s,也就是基準網路輸送量限制。如需有關網路和磁碟輸送量限制的詳細資訊,請參閱中的檔案系統效能表彙總檔案系統效能。如需有關資料壓縮效能的詳細資訊,請參閱儲存部落格上的 Amazon FSx for Lustre 資料壓縮同時提高效能的花費更少
管理資料壓縮
建立新的 Amazon FSx for Lustre 檔案系統時,您可以開啟或關閉資料壓縮。當您從主控台或 API 建立 Amazon FSx for Lustre 檔案系統時, AWS CLI預設會關閉資料壓縮。
-
開啟 Amazon FSx 主控台,網址為 https://console.aws.amazon.com/fsx/
。 請遵循〈入門〉一節中所述的步驟 1:創建您FSx的光澤文件系統建立新檔案系統的程序。
在 [檔案系統詳細資料] 區段中,選擇 LZ 4 做為 [資料壓縮類型]。
-
當您建立新的檔案系統時,完成精靈的作業。
-
選擇 Review and create (檢閱和建立)。
-
檢閱您為 Lustre 檔案系統的 Amazon FSx 選擇的設定,然後選擇 [建立檔案系統]。
當檔案系統為可用時,會開啟資料壓縮。
若要在開啟資料壓縮的情況下為 Lustre 檔案系統建立 FSx,請使用具
create-file-system
有DataCompressionType
參數的 Amazon FSx CLI 命令,如下所示。對應的 API 操作是CreateFileSystem。$
aws fsx create-file-system \ --client-request-token CRT1234 \ --file-system-type LUSTRE \ --file-system-type-version 2.12 \ --lustre-configuration DeploymentType=PERSISTENT_1,PerUnitStorageThroughput=50,DataCompressionType=LZ4 \ --storage-capacity 3600 \ --subnet-ids subnet-123456 \ --tags Key=Name,Value=Lustre-TEST-1 \ --region us-east-2
成功建立檔案系統之後,Amazon FSx 會將檔案系統描述傳回為 JSON,如下列範例所示。
{
"FileSystems": [
{
"OwnerId": "111122223333",
"CreationTime": 1549310341.483,
"FileSystemId": "fs-0123456789abcdef0",
"FileSystemType": "LUSTRE",
"FileSystemTypeVersion": "2.12",
"Lifecycle": "CREATING",
"StorageCapacity": 3600,
"VpcId": "vpc-123456",
"SubnetIds": [
"subnet-123456"
],
"NetworkInterfaceIds": [
"eni-039fcf55123456789"
],
"DNSName": "fs-0123456789abcdef0.fsx.us-east-2.amazonaws.com",
"ResourceARN": "arn:aws:fsx:us-east-2:123456:file-system/fs-0123456789abcdef0",
"Tags": [
{
"Key": "Name",
"Value": "Lustre-TEST-1"
}
],
"LustreConfiguration": {
"DeploymentType": "PERSISTENT_1",
"DataCompressionType": "LZ4",
"PerUnitStorageThroughput": 50
}
}
]
}
您也可以變更現有檔案系統的資料壓縮組態。當您為現有檔案系統開啟資料壓縮時,只會壓縮新寫入的檔案,而且不會壓縮現有檔案。如需詳細資訊,請參閱 壓縮先前寫入的檔案。
開啟 Amazon FSx 主控台,網址為 https://console.aws.amazon.com/fsx/
。 -
瀏覽至檔案系統,然後選擇您要管理資料壓縮的 Lustre 檔案系統。
-
在動作中,選擇更新資料壓縮類型。
在 [更新資料壓縮類型] 對話方塊中,選擇 [LZ4] 以開啟資料壓縮,或選擇 [無] 將其關閉。
選擇更新。
您可以在 [更新] 索引標籤的檔案系統詳細資料頁面上監視更新進度。
若要更新 Lustre 檔案系統之現有 FSx 的資料壓縮組態,請使用指令。 AWS CLI update-file-system設定下列參數:
-
設定
--file-system-id
為您要更新之檔案系統的 ID。 -
設定
--lustre-configuration DataCompressionType
NONE
為可關閉資料壓縮或使LZ4
用 LZ4 演算法開啟資料壓縮。
此命令指定使用 LZ4 演算法開啟資料壓縮。
$ aws fsx update-file-system \ --file-system-id fs-0123456789abcdef0 \ --lustre-configuration DataCompressionType=LZ4
從備份創建文件系統時的數據壓縮配置
您可以使用可用的備份來建立新的 Amazon FSx for Lustre) 檔案系統。當您從備份建立新的檔案系統時,不需要指定DataCompressionType
;將使用備份的設定來套用此DataCompressionType
設定。如果您選擇在從備份建立DataCompressionType
時指定,則值必須符合備份的DataCompressionType
設定。
若要檢視備份上的設定,請從 Amazon FSx 主控台的「備份」索引標籤中選擇備份。備份的詳細資料將列在備份的摘要頁面上。您也可以執行describe-backups
AWS CLI 命令 (等效的 API 動作為 DescribeBackups
)。
壓縮先前寫入的檔案
如果檔案是在 Lustre 檔案系統的 Amazon FSx 上關閉資料壓縮時建立的,則檔案將會解壓縮。開啟資料壓縮功能並不會自動壓縮現有的未壓縮資料。
您可以使用作為 Lustre 客戶端安裝一部分安裝的lfs_migrate
命令來壓縮現有文件。如需範例,請參閱上提供的 FSXL 壓縮
檢視檔案大小
您可以使用以下命令來查看文件和目錄的未壓縮和壓縮大小。
-
du
顯示壓縮的大小。 -
du --apparent-size
顯示未壓縮的大小。 -
ls -l
顯示未壓縮的大小。
下列範例顯示具有相同檔案之每個命令的輸出。
$
du -sh samplefile
272M samplefile$
du -sh --apparent-size samplefile
1.0G samplefile$
ls -lh samplefile
-rw-r--r-- 1 root root 1.0G May 10 21:16 samplefile
此選-h
項對於這些指令很有用,因為它會以人類可讀的格式列印大小。
使用 CloudWatch 指標
您可以使用 Amazon CloudWatch 日誌指標來檢視檔案系統的使用情況。此LogicalDiskUsage
測量結果顯示邏輯磁碟使用總計 (未壓縮),而PhysicalDiskUsage
測量結果則顯示實體磁碟使用量 (壓縮) 的總計。只有在您的檔案系統已啟用資料壓縮或先前已啟用資料壓縮時,才能使用這兩個量度。
您可以藉由將統計資料除以統計資料,來決定檔案系LogicalDiskUsage
PhysicalDiskUsage
統Sum
的壓縮率。Sum
如需有關使用公制數學計算此比率的資訊,請參閱公制數學:資料壓縮率。
如需監視檔案系統效能的詳細資訊,請參閱監控 Amazon FSx for Lustre。