AWS Data Pipeline 极限

为确保所有用户都有容量， AWS Data Pipeline 会对您可以分配的资源和分配资源的速率施加限制。

内容

账户限制
Web 服务调用限制
扩展注意事项

账户限制

以下限制适用于单个 AWS 账户。如果您需要额外容量，可以使用 Amazon Web Services 支持中心请求表增加容量。

属性	限制	可调整
管线数量	100	是
每个管道的对象数量	100	是
每个对象的活动实例数量	5	是
每个对象的字段数量	50	不可以
每个字段名或标识符的 UTF8 字节数	256	否
每个字段的 UTF8 字节数	10240	否
每个对象的 UTF8 字节数	15360（包括字段名）	否
对象的实例创建速率	每 5 分钟一个	否
管道活动的重试次数	每个任务 5 次	否
重试之间的最短延迟	2 分钟	否
最短计划时间间隔	15 分钟	否
单个对象的累计最大数量	32	否
每个 Ec2Resource 对象的最大 EC2 实例数	1	否

Web 服务调用限制

AWS Data Pipeline 限制了您可以调用 Web 服务 API 的速率。这些限制也适用于代表您调用 Web 服务 API 的 AWS Data Pipeline 代理，例如控制台、CLI 和任务运行器。

以下限制适用于单个 AWS 账户。这意味着，该账户的总使用量（包括用户产生的使用量）不能超过这些限制。

突增速率可让您在非活动期间节省 Web 服务调用并在很短的时间内扩展这些调用。例如， CreatePipeline 固定速率为每五秒钟一个呼叫。如果在 30 秒内未调用该服务，则会节省 6 次调用。您可以随后在 1 秒内调用 6 次 Web 服务。由于该值低于突增限制并确保您的平均调用次数符合常规速率限制，因此，您的调用不受限制。

如果您超出速率限制和突增限制，则您的 Web 服务调用将失败并返回限制异常。任务运行程序工作线程的默认实施自动重试发生限制异常的失败 API 调用。任务运行程序使用退避，以便后续 API 调用尝试具有逐渐增加的间隔。如果您编写工作线程，我们建议您实施类似的重试逻辑。

这些限制适用于个人 AWS 账户。

API	常规速率限制	突增限制
ActivatePipeline	每秒调用 1 次	100 次调用
CreatePipeline	每秒调用 1 次	100 次调用
DeletePipeline	每秒调用 1 次	100 次调用
DescribeObjects	每秒调用 2 次	100 次调用
DescribePipelines	每秒调用 1 次	100 次调用
GetPipelineDefinition	每秒调用 1 次	100 次调用
PollForTask	每秒调用 2 次	100 次调用
ListPipelines	每秒调用 1 次	100 次调用
PutPipelineDefinition	每秒调用 1 次	100 次调用
QueryObjects	每秒调用 2 次	100 次调用
ReportTaskProgress	每秒调用 10 次	100 次调用
SetTaskStatus	每秒调用 10 次	100 次调用
SetStatus	每秒调用 1 次	100 次调用
ReportTaskRunnerHeartbeat	每秒调用 1 次	100 次调用
ValidatePipelineDefinition	每秒调用 1 次	100 次调用

扩展注意事项

AWS Data Pipeline 可扩展以容纳大量并发任务，您可以将其配置为自动创建处理大型工作负载所需的资源。这些自动创建的资源由您控制，并计入您的 AWS 账户资源限制。例如，如果您配置 AWS Data Pipeline 为自动创建一个 20 个节点的 Amazon EMR 集群来处理数据，并且 AWS 您的账户的 EC2 实例限制设置为 20，则可能会无意中耗尽可用的回填资源。因此，在设计中请考虑这些资源限制或相应增加您的账户限制。

如果您需要额外容量，可以使用 Amazon Web Services 支持中心请求表增加容量。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

解决常见问题

AWS Data Pipeline Resources