本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 AWS 数据库迁移服务 (DMS) 迁移到亚马逊 DocumentDB:快速入门指南
准备 DMS 源代码
启用变更流要启用 DocumentDB 变更流,请参见启用 MongoDB Oplog 以支持 DMS 变更数据捕获 (CDC)。
DMS 源必须保留所有正在进行的更改,直到所有包含的集合的 DMS 满载完成。
DocumentDB 变更流是基于时间的。确保您的
change_stream_log_retention_duration
设置足够大,足以涵盖完成满载所需的时间。MongoDB Oplog 的大小是固定的。确保其大小可容纳满载期间的所有操作。
设置 DMS
创建 DMS 实例、源端点和目标端点并测试每个终端节点。
启用 DocumentDB 压缩
通过将自定义参数组附加到 DocumentDB 集群并将默认集合压缩参数更新为启用来启用压缩。请参阅管理集合级文档压缩了解更多信息。
创建复制任务
在 DMS 控制台的导航窗格中,选择迁移或复制,然后选择任务。
选择创建任务。
在创建任务页面的任务配置部分:
输入唯一且有意义的任务标识符(例如,mongodb-docdb-replication“”)。
在源数据库终端节点下拉菜单中选择您之前创建的源端点。
在目标数据库终端节点下拉菜单中选择您之前创建的目标终端节点。
对于 “任务类型”,选择 “迁移和复制”。
在 “设置” 部分:
对于任务日志,请选中 “打开日 CloudWatch志” 复选框。
对于编辑模式(位于部分顶部),选择 JSON 编辑器并设置以下属性:
设置
ParallelApplyThreads
为 5(低于TargetMetadata
)。这样可以在 CDC 中每秒进行大约 1000 次insert/update/delete操作。设置
MaxFullLoadSubTasks
为 16(低于FullLoadSettings
)。考虑根据您的实例大小增加此值。对于大型集合(超过 100 GB),请启用自动分区(在 “表映射” 下和
parallel-load
属性下):“类型”:“分区-自动”
number-of-partitions“: 16
监控进度
使用 AWS DMS 控制台或创建自定义仪表板(仪表板工具
FullLoadThroughputBandwidthTarget— 测量 DMS 在迁移满载阶段向目标数据库传输数据时使用的网络带宽(以 KB/秒为单位)。
CDCLatency目标-测量从源数据库发生更改到将更改应用于目标数据库之间的时间延迟(以秒为单位)。
CDCThroughputRowsTarget— 测量 DMS 在迁移的持续复制阶段每秒向目标数据库应用的行数。
其他信息
有关 Amazon DocumentDB 和的更多信息 AWS DMS,请参阅:更多信息请参阅。