使用 AWS Database Migration Service (DMS) 遷移至 Amazon DocumentDB:快速入門指南 - Amazon DocumentDB

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 AWS Database Migration Service (DMS) 遷移至 Amazon DocumentDB:快速入門指南

準備 DMS 來源

請參閱 啟用變更串流 以啟用 DocumentDB 變更串流,或啟用 MongoDB Oplog 以支援 DMS 變更資料擷取 (CDC)。

  • DMS 來源必須保留所有持續變更,直到所有包含集合的 DMS 完全載入完成為止。

  • DocumentDB 變更串流以時間為基礎。請確定您的change_stream_log_retention_duration設定夠大,足以涵蓋完成完整載入的時間。

  • MongoDB Oplog 是固定大小。確定其大小足以在完全載入期間保留所有操作。

設定 DMS

建立 DMS 執行個體、來源和目標端點,並測試每個端點。

啟用 DocumentDB 壓縮

將自訂參數群組連接至 DocumentDB 叢集,並將 default_collection_compression 參數更新為已啟用,以啟用壓縮。如需詳細資訊,請參閱管理集合層級文件壓縮

建立複寫任務

  1. 在 DMS 主控台的導覽窗格中,選擇遷移或複寫,然後選擇任務

  2. 選擇 Create task (建立任務)

  3. 建立任務頁面上的任務組態區段中:

    • 輸入唯一且有意義的任務識別符 (例如,「mongodb-docdb-replication」)。

    • 選擇您先前在來源資料庫端點下拉式功能表中建立的來源端點

    • 選擇您先前在目標資料庫端點下拉式功能表中建立的目標端點

    • 針對任務類型,選擇遷移和複寫

  4. 設定區段中:

    • 對於任務日誌,勾選開啟 CloudWatch 日誌方塊。

    • 對於編輯模式 (在區段頂端),選擇 JSON 編輯器並設定下列屬性:

      • ParallelApplyThreads 設定為 5 (在 下TargetMetadata)。這會在 CDC 中啟用每秒約 1000 個 insert/update/delete ops。

      • MaxFullLoadSubTasks 設定為 16 (在 下FullLoadSettings)。考慮根據您的執行個體大小增加此值。

      • 對於大型集合 (超過 100 GB),啟用自動分割 (在資料表映射下和 parallel-load 屬性下):

        • "type": "partitions-auto"

        • 「number-of-partitions」:16

監控進度

使用 AWS DMS 主控台或建立自訂儀表板 (儀表板工具) 來追蹤遷移。專注於下列指標:

  • FullLoadThroughputBandwidthTarget — 在遷移的完整載入階段期間,測量 DMS 在將資料傳輸至目標資料庫時所使用的網路頻寬 (以 KB/秒為單位)。

  • CDCLatencyTarget — 測量來源資料庫中發生變更,以及將該變更套用至目標資料庫時的時間延遲 (以秒為單位)。

  • CDCThroughputRowsTarget — 在遷移的持續複寫階段,測量 DMS 每秒套用至目標資料庫的資料列數。

其他資訊

如需 Amazon DocumentDB 和 的詳細資訊 AWS DMS,請參閱:如需詳細資訊,請參閱 。