使用資料儲存庫工作匯出變更 - FSx for Lustre

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用資料儲存庫工作匯出變更

匯出資料儲存庫工作會匯出檔案系統中新增或變更的檔案。它會在 S3 中為檔案系統上的任何新檔案建立新物件。對於在檔案系統上修改過的任何檔案,或其中繼資料已修改過的任何檔案,S3 中的對應物件都會取代為具有新資料和中繼資料的新物件。不會針對已從檔案系統中刪除的檔案採取任何動作。

注意

使用匯出資料儲存庫作業時,請記住下列事項:

  • 不支援使用萬用字元來包含或排除要匯出的檔案。

  • 執行mv操作時,即使沒有 UID、GID、權限或內容變更,移動後的目標檔案也會匯出到 S3。

使用 Amazon FSx 主控台和 CLI,使用下列程序將檔案系統上的資料和中繼資料變更匯出到連結的 S3 儲存貯體。請注意,您可以針對多個 DRA 使用一個資料存放庫工作。

  1. 開啟 Amazon FSx 主控台,網址為 https://console.aws.amazon.com/fsx/

  2. 在導覽窗格中,選擇 [檔案系統],然後選擇您的 Lustre 檔案系統。

  3. 選擇「資料儲存庫」頁籤。

  4. 在「資料存放庫關聯」窗格中,選擇您要為其建立匯出任務的資料存放庫關聯。

  5. 在「動作」 中選擇「匯出工作」。如果檔案系統未連結至 S3 上的資料儲存庫,則無法使用此選項。建立匯出資料儲存庫工作對話方塊隨即出現

    建立資料儲存庫作業頁面
  6. (選擇性) 在要匯出的檔案系統路徑中提供這些目錄或檔案的路徑,指定最多 32 個要從 Amazon FSx 檔案系統匯出的目錄或檔案。您提供的路徑必須相對於檔案系統的掛載點。如果掛載點是/mnt/fsx/mnt/fsx/path1是您要匯出之檔案系統上的目錄或檔案,則要提供的路徑為path1

    注意

    如果您提供的路徑無效,工作就會失敗。

  7. (選擇性) 選擇 [完成報告] 下的 [啟用],以在工作完成後產生工作完成報告。任務完成報告提供有關符合告範圍中提供之範圍之工作所處理之檔案的詳細資訊。若要指定 Amazon FSx 傳遞報表的位置,請在檔案系統的連結 S3 資料儲存庫上輸入報表路徑的相對路徑

  8. 選擇建立

    [檔案系統] 頁面頂端的通知會顯示您剛剛建立進行中的工作。

若要檢視工作狀態和詳細資訊,請向下捲動至檔案系統之「資料儲存庫」標籤中的「資料儲存庫工作」窗格。預設排序順序會在清單頂端顯示最近的工作。

若要從此頁面檢視作業摘要,請為您剛建立的工作選擇「工作 ID」。此時會顯示作業的「摘要」頁面。

  • 使用 create-data-repository-taskCLI 指令匯出 FSx for Lustre 檔案系統上的資料和中繼資料變更。對應的 API 操作是CreateDataRepositoryTask

    $ aws fsx create-data-repository-task \ --file-system-id fs-0123456789abcdef0 \ --type EXPORT_TO_REPOSITORY \ --paths path1,path2/file1 \ --report Enabled=true

    成功建立資料儲存庫任務後,Amazon FSx 會傳回任務說明為 JSON,如下列範例所示。

    { "Task": { "TaskId": "task-123f8cd8e330c1321", "Type": "EXPORT_TO_REPOSITORY", "Lifecycle": "PENDING", "FileSystemId": "fs-0123456789abcdef0", "Paths": ["path1", "path2/file1"], "Report": { "Path":"s3://dataset-01/reports", "Format":"REPORT_CSV_20191124", "Enabled":true, "Scope":"FAILED_FILES_ONLY" }, "CreationTime": "1545070680.120", "ClientRequestToken": "10192019-drt-12", "ResourceARN": "arn:aws:fsx:us-east-1:123456789012:task:task-123f8cd8e330c1321" } }

建立將資料匯出至連結資料儲存庫的工作之後,您可以檢查匯出資料儲存庫作業的狀態。如需檢視資料儲存庫工作的詳細資訊,請參閱存取資料儲存庫工作