AWS Data Pipeline 不再向新客户提供。的现有客户 AWS Data Pipeline 可以继续照常使用该服务。了解更多
本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
AWS Data Pipeline 限制
为了确保所有用户的容量,AWS Data Pipeline 会对您可分配的资源以及资源分配速率施加限制。
账户限制
以下限制适用于单个 AWS 账户。如果您需要额外容量,可以使用 Amazon Web Services 支持中心请求表
属性 | 限制 | 可调整 |
---|---|---|
管线数量 | 100 | 是 |
每个管道的对象数量 | 100 | 是 |
每个对象的活动实例数量 | 5 | 是 |
每个对象的字段数量 | 50 | 否 |
每个字段名或标识符的 UTF8 字节数 | 256 | 否 |
每个字段的 UTF8 字节数 | 10240 | 否 |
每个对象的 UTF8 字节数 | 15360(包括字段名) | 否 |
对象的实例创建速率 | 每 5 分钟一个 | 否 |
管道活动的重试次数 | 每个任务 5 次 | 否 |
重试之间的最短延迟 | 2 分钟 | 否 |
最短计划时间间隔 | 15 分钟 | 否 |
单个对象的累计最大数量 | 32 | 否 |
每个 Ec2Resource 对象的最大 EC2 实例数量 | 1 | 否 |
Web 服务调用限制
AWS Data Pipeline 将限制可调用 Web 服务 API 的速率。这些限制也适用于代表您调用 Web 服务 API 的 AWS Data Pipeline 代理,例如控制台、CLI 和任务运行程序。
以下限制适用于单个 AWS 账户。这意味着,该账户的总使用量(包括 用户产生的使用量)不能超过这些限制。
突增速率可让您在非活动期间节省 Web 服务调用并在很短的时间内扩展这些调用。例如,CreatePipeline 的常规速率为每 5 秒执行 1 次调用。如果在 30 秒内未调用该服务,则会节省 6 次调用。您可以随后在 1 秒内调用 6 次 Web 服务。由于该值低于突增限制并确保您的平均调用次数符合常规速率限制,因此,您的调用不受限制。
如果您超出速率限制和突增限制,则您的 Web 服务调用将失败并返回限制异常。任务运行程序工作线程的默认实施自动重试发生限制异常的失败 API 调用。任务运行程序使用退避,以便后续 API 调用尝试具有逐渐增加的间隔。如果您编写工作线程,我们建议您实施类似的重试逻辑。
针对单个 AWS 账户应用这些限制。
API | 常规速率限制 | 突增限制 |
---|---|---|
ActivatePipeline | 每秒调用 1 次 | 100 次调用 |
CreatePipeline | 每秒调用 1 次 | 100 次调用 |
DeletePipeline | 每秒调用 1 次 | 100 次调用 |
DescribeObjects | 每秒调用 2 次 | 100 次调用 |
DescribePipelines | 每秒调用 1 次 | 100 次调用 |
GetPipelineDefinition | 每秒调用 1 次 | 100 次调用 |
PollForTask | 每秒调用 2 次 | 100 次调用 |
ListPipelines | 每秒调用 1 次 | 100 次调用 |
PutPipelineDefinition | 每秒调用 1 次 | 100 次调用 |
QueryObjects | 每秒调用 2 次 | 100 次调用 |
ReportTaskProgress | 每秒调用 10 次 | 100 次调用 |
SetTaskStatus | 每秒调用 10 次 | 100 次调用 |
SetStatus | 每秒调用 1 次 | 100 次调用 |
ReportTaskRunnerHeartbeat | 每秒调用 1 次 | 100 次调用 |
ValidatePipelineDefinition | 每秒调用 1 次 | 100 次调用 |
扩展注意事项
AWS Data Pipeline 扩展以满足大量并发任务,您可以将其配置为自动创建所需的资源以处理大型工作负载。这些自动创建的资源由您控制,并计入您的 AWS 账户资源限制。例如,如果您配置 AWS Data Pipeline 自动创建 20 个节点的 Amazon EMR 集群以处理数据,并且您的 AWS 账户的 EC2 实例限制设置为 20,您可能会无意中用尽可用的回填资源。因此,在设计中请考虑这些资源限制或相应增加您的账户限制。
如果您需要额外容量,可以使用 Amazon Web Services 支持中心请求表