將現有檔案移轉至 FSx for Windows File Server 使用) AWS DataSync - Amazon FSx for Windows File Server

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將現有檔案移轉至 FSx for Windows File Server 使用) AWS DataSync

我們建議使用 AWS DataSync 在 FSx 之間傳輸資料,適用於 Windows 檔案伺服器的檔案系統。 DataSync 是一種資料傳輸服務,可透過網際網路或其他儲存服務,簡化、自動化及加速內部部署儲存系統與其他 AWS 儲存服務之間的資料移動和複寫速度。 AWS Direct Connect DataSync 可以傳輸您的檔案系統資料和中繼資料,例如擁有權、時間戳記和存取權限。

DataSync 支援複製 NTFS 存取控制清單 (ACL),並且還支援複製檔案稽核控制資訊,也稱為 NTFS 系統存取控制清單 (SACL),系統管理員會使用這些清單來控制使用者嘗試存取檔案的稽核記錄。

您可 DataSync 以使用在 Windows 檔案伺服器檔案系統的兩個 FSx 之間傳輸檔案,也可以將資料移至不同 AWS 區域 或 AWS 帳戶中的檔案系統。您可以 DataSync 搭配 FSx 使用 Windows 檔案伺服器檔案系統來執行其他工作。例如,您可以執行一次性資料移轉、定期擷取分散式工作負載的資料,以及排程複寫以進行資料保護和復原。

在中 AWS DataSync,適用於 FSx for Windows File Server 位置是適用於 FSx for Windows File Server 端點。您可以在 Windows 檔案伺服器的 FSx 位置與其他檔案系統的位置之間傳輸檔案。若要取得資訊,請參閱《使用指南》中的〈AWS DataSync 使用位置

DataSync 使用伺服器訊息區 (SMB) 通訊協定存取 Windows 檔案伺服器的 FSx。它會使用您在 AWS DataSync 主控台或中設定的使用者名稱和密碼進行驗證。 AWS CLI

必要條件

若要將資料遷移到 Amazon FSx for Windows File Server 的設定中,您需要符合需 DataSync 求的伺服器和網路。若要深入瞭解,請參閱《AWS DataSync 使用者指南》 DataSync中的「的需求」。

如果您要執行大型資料遷移,或是涉及許多小型檔案的遷移,建議您使用具有 SSD 儲存類型的 Amazon FSx 檔案系統。這是因為 DataSync 任務涉及文件元數據的掃描,這可能會耗盡 HDD 文件系統的磁盤 IOPS 限制,從而導致長時間運行的遷移和文件系統性能影響。如需詳細資訊,請參閱 將現有檔案儲存裝置移轉至適用於 Windows 檔案伺服器的 FSx 的最佳作法

如果您的資料集大部分是小型檔案、檔案總數 (以百萬計),或者您的可用網路頻寬超過單一 DataSync 工作的使用量,您也可以使用向外擴充架構加速資料傳輸。如需詳細資訊,請參閱:如何使用橫向 AWS DataSync 擴充架構加速資料傳輸

您可以使用 FSx 效能測量結果來監督檔案系統的磁碟 I/O 使用率。

使用移轉檔案的基本步驟 DataSync

若要使用將檔案從來源位置傳輸到目標位置 DataSync,請執行下列基本步驟:

  • 在您的環境下載並部署代理程式,並啟用該代理程式。

  • 建立和設定來源與目的地位置。

  • 建立並設定任務。

  • 執行任務以將檔案從來源傳輸至目的地。

若要了解如何將檔案從現有的現場部署檔案系統傳輸到 FSx for Windows File Server,請參閱使用者指南中的自我管理儲存體之間的資料傳輸和 AWS建立 SMB 位置和建立適用於 Windows 檔案伺服器的 Amazon FSx 位置。AWS DataSync

若要了解如何將檔案從現有雲端檔案系統傳輸到適用 FSx for Windows File Server,請參閱AWS DataSync 使用者指南中的將代理程式部署為 Amazon EC2 執行個體。

在兩個 Amazon FSx 檔案系統之間進行遷移

您可以使 DataSync 用在兩個 Amazon FSx 檔案系統之間遷移資料。如果您需要將工作負載從現有檔案系統移至具有不同組態的新檔案系統,例如從單一可用區組態移至異地同步備份組態,此功能會很有幫助。您也可以使用 DataSync 在兩個檔案系統之間分割工作負載。

以下是移轉程序的概觀範例:

  1. 建立來源檔案系統和目標檔案系統的 DataSync 位置。請注意,來源和目的地必須屬於相同的 Active Directory (AD) 網域,或在其網域之間具有 AD 信任關係。

  2. 建立並設定 DataSync 工作,將資料從來源傳輸到目的地。您可以將工作作為一次性執行個體執行,或將工作設定為根據您設定的排程自動執行。

  3. 工作順利完成之後,目的地檔案系統中的資料就是來源的精確副本。請注意,您必須暫時暫停來源檔案系統上的任何寫入活動或檔案更新,才能完成工作。然後,您可以切換到目標文件系統並刪除源文件系統。

從生產檔案系統移轉之前,您可以在從最近備份還原的檔案系統上測試移轉程序。這可讓您估計資料傳輸程序需要多長時間,並事先對 DataSync 錯誤進行疑難排解。

若要將切換時間縮到最短,您可以事先 DataSync 執行工作,將大部分資料從來源檔案系統移至目的檔案系統。停止來源檔案系統的流量之後,您可以執行一次最後的工作傳輸,以同步處理因為您停止流量後新更新的任何資料,然後切換到目的地檔案系統。

您可以將 DataSync 工作設定為僅在特定目錄中執行,或包含或排除特定路徑。如果您要同時執 parallel 多個工作,或者想要遷移資料的子集,這會很有用。

您可以在目的地檔案系統上建立與來源檔案系統 DNS 名稱相同的 DNS 別名。這可讓您的最終使用者和應用程式繼續使用來源檔案系統的 DNS 名稱來存取檔案資料。如需如何設定 DNS 別名的詳細資訊,請參閱:使用 DNS 別名存取您的檔案系統

執行此類型的移轉時,我們建議您執行下列動作:

  • 排程您的移轉,以避免任何檔案系統備份、每週維護時段和Data Deduplication工作。具體來說,如果Data Deduplication GarbageCollection工作與您計劃的移轉重合,我們建議您停用該工作。

  • 您的來源和目的檔案系統都使用 SSD 儲存類型。您可以通過從備份還原來在 HDD 和 SSD 存儲類型之間切換。如需詳細資訊,請參閱:將現有的檔案儲存移轉至 FSx for Windows File Server

  • 針對您需要傳輸的資料量,設定您的來源和目的地檔案系統,具有足夠的輸送量容量。在 DataSync 工作程序期間,監視來源檔案系統和目的檔案系統的效能使用率。如需詳細資訊,請參閱 使用 Amazon 監控 CloudWatch

  • 設置DataSync 監視以幫助您了解正在進行的任務的進度。您也可以將 DataSync 日誌傳送到 Amazon CloudWatch 日誌群組,以協助您在遇到任何錯誤時對任務進行除錯。