光澤資料壓縮 - FSx為了光澤

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

光澤資料壓縮

您可以使用 Lustre 資料壓縮功能,在適用於 Lustre 檔案系統和備份儲存的高效能 Amazon FSx 上節省成本。啟用資料壓縮後,Amazon FSx for Lustre 會在新寫入的檔案寫入磁碟之前自動壓縮這些檔案,並在讀取檔案時自動解壓縮這些檔案。

資料壓縮使用 LZ4 演算法,此演算法經過最佳化,可提供高階壓縮,而不會對檔案系統效能造成負面影響。LZ4 是 Lustre 社群信任且以效能為導向的演算法,可在壓縮速度和壓縮檔案大小之間取得平衡。啟用資料壓縮通常不會對延遲產生可衡量的影響。

資料壓縮可減少適用於 Lustre 檔案伺服器和儲存的 Amazon FSx 之間傳輸的資料量。如果您尚未使用壓縮檔案格式,在使用資料壓縮時,您會看到整體檔案系統輸送量容量有所增加。在您飽和前端網路介面卡之後,與資料壓縮相關的輸送量容量增加將會受到上限。

例如,如果您的檔案系統是 PERSISTENT-50 SSD 部署類型,則網路輸送量的基準為每 TiB 每秒 250 MB/s 的儲存體。您的磁碟輸送量基準為每 TiB 50 MB/s。透過資料壓縮,您的磁碟輸送量可能會從每 TiB 50 MB/s 增加到每 TiB 的最大 250 MB/s,也就是基準網路輸送量限制。如需有關網路和磁碟輸送量限制的詳細資訊,請參閱中的檔案系統效能表彙總檔案系統效能如需有關資料壓縮效能的詳細資訊,請參閱儲存部落格上的 Amazon FSx for Lustre 資料壓縮同時提高效能的花費更少。AWS

管理資料壓縮

建立新的 Amazon FSx for Lustre 檔案系統時,您可以開啟或關閉資料壓縮。當您從主控台或 API 建立 Amazon FSx for Lustre 檔案系統時, AWS CLI預設會關閉資料壓縮。

  1. 開啟 Amazon FSx 主控台,網址為 https://console.aws.amazon.com/fsx/

  2. 請遵循〈入門〉一節中所述的步驟 1:創建您FSx的光澤文件系統建立新檔案系統的程序。

  3. 在 [檔案系統詳細資料] 區段中,選擇 LZ 4 做為 [資料壓縮類型]。

  4. 當您建立新的檔案系統時,完成精靈的作業。

  5. 選擇 Review and create (檢閱和建立)。

  6. 檢閱您為 Lustre 檔案系統的 Amazon FSx 選擇的設定,然後選擇 [建立檔案系統]。

當檔案系統為可用時,會開啟資料壓縮。

  • 若要在開啟資料壓縮的情況下為 Lustre 檔案系統建立 FSx,請使用具create-file-systemDataCompressionType參數的 Amazon FSx CLI 命令,如下所示。對應的 API 操作是CreateFileSystem

    $ aws fsx create-file-system \ --client-request-token CRT1234 \ --file-system-type LUSTRE \ --file-system-type-version 2.12 \ --lustre-configuration DeploymentType=PERSISTENT_1,PerUnitStorageThroughput=50,DataCompressionType=LZ4 \ --storage-capacity 3600 \ --subnet-ids subnet-123456 \ --tags Key=Name,Value=Lustre-TEST-1 \ --region us-east-2

成功建立檔案系統之後,Amazon FSx 會將檔案系統描述傳回為 JSON,如下列範例所示。

{ "FileSystems": [ { "OwnerId": "111122223333", "CreationTime": 1549310341.483, "FileSystemId": "fs-0123456789abcdef0", "FileSystemType": "LUSTRE", "FileSystemTypeVersion": "2.12", "Lifecycle": "CREATING", "StorageCapacity": 3600, "VpcId": "vpc-123456", "SubnetIds": [ "subnet-123456" ], "NetworkInterfaceIds": [ "eni-039fcf55123456789" ], "DNSName": "fs-0123456789abcdef0.fsx.us-east-2.amazonaws.com", "ResourceARN": "arn:aws:fsx:us-east-2:123456:file-system/fs-0123456789abcdef0", "Tags": [ { "Key": "Name", "Value": "Lustre-TEST-1" } ], "LustreConfiguration": { "DeploymentType": "PERSISTENT_1", "DataCompressionType": "LZ4", "PerUnitStorageThroughput": 50 } } ] }

您也可以變更現有檔案系統的資料壓縮組態。當您為現有檔案系統開啟資料壓縮時,只會壓縮新寫入的檔案,而且不會壓縮現有檔案。如需詳細資訊,請參閱 壓縮先前寫入的檔案

  1. 開啟 Amazon FSx 主控台,網址為 https://console.aws.amazon.com/fsx/

  2. 瀏覽至檔案系統,然後選擇您要管理資料壓縮的 Lustre 檔案系統。

  3. 在動中,選擇更新資料壓縮類型

  4. 在 [更新資料壓縮類型] 對話方塊中,選擇 [LZ4] 以開啟資料壓縮,或選擇 [] 將其關閉。

  5. 選擇更新

  6. 您可以在 [更新] 索引標籤的檔案系統詳細資料頁面上監視更新進度。

若要更新 Lustre 檔案系統之現有 FSx 的資料壓縮組態,請使用指令。 AWS CLI update-file-system設定下列參數:

  • 設定--file-system-id為您要更新之檔案系統的 ID。

  • 設定--lustre-configuration DataCompressionTypeNONE為可關閉資料壓縮或使LZ4用 LZ4 演算法開啟資料壓縮。

此命令指定使用 LZ4 演算法開啟資料壓縮。

$ aws fsx update-file-system \ --file-system-id fs-0123456789abcdef0 \ --lustre-configuration DataCompressionType=LZ4

從備份創建文件系統時的數據壓縮配置

您可以使用可用的備份來建立新的 Amazon FSx for Lustre) 檔案系統。當您從備份建立新的檔案系統時,不需要指定DataCompressionType;將使用備份的設定來套用此DataCompressionType設定。如果您選擇在從備份建立DataCompressionType時指定,則值必須符合備份的DataCompressionType設定。

若要檢視備份上的設定,請從 Amazon FSx 主控台的「備份」索引標籤中選擇備份。備份的詳細資料將列在備份的摘要頁面上。您也可以執行describe-backups AWS CLI 命令 (等效的 API 動作為 DescribeBackups)。

壓縮先前寫入的檔案

如果檔案是在 Lustre 檔案系統的 Amazon FSx 上關閉資料壓縮時建立的,則檔案將會解壓縮。開啟資料壓縮功能並不會自動壓縮現有的未壓縮資料。

您可以使用作為 Lustre 客戶端安裝一部分安裝的lfs_migrate命令來壓縮現有文件。如需範例,請參閱上提供的 FSXL 壓縮。 GitHub

檢視檔案大小

您可以使用以下命令來查看文件和目錄的未壓縮和壓縮大小。

  • du顯示壓縮的大小。

  • du --apparent-size顯示未壓縮的大小。

  • ls -l顯示未壓縮的大小。

下列範例顯示具有相同檔案之每個命令的輸出。

$ du -sh samplefile 272M samplefile $ du -sh --apparent-size samplefile 1.0G samplefile $ ls -lh samplefile -rw-r--r-- 1 root root 1.0G May 10 21:16 samplefile

此選-h項對於這些指令很有用,因為它會以人類可讀的格式列印大小。

使用 CloudWatch 指標

您可以使用 Amazon CloudWatch 日誌指標來檢視檔案系統的使用情況。此LogicalDiskUsage測量結果顯示邏輯磁碟使用總計 (未壓縮),而PhysicalDiskUsage測量結果則顯示實體磁碟使用量 (壓縮) 的總計。只有在您的檔案系統已啟用資料壓縮或先前已啟用資料壓縮時,才能使用這兩個量度。

您可以藉由將統計資料除以統計資料,來決定檔案系LogicalDiskUsagePhysicalDiskUsageSum的壓縮率。Sum如需有關使用公制數學計算此比率的資訊,請參閱公制數學:資料壓縮率

如需監視檔案系統效能的詳細資訊,請參閱監控 Amazon FSx for Lustre