AWS Data Pipeline 不再向新客户提供。的现有客户 AWS Data Pipeline 可以继续照常使用该服务。了解更多
本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
管道定义
管道定义是您与之沟通业务逻辑的方式 AWS Data Pipeline。它包含以下信息:
-
您数据源的名称、位置和格式
-
转换数据的活动
-
这些活动的计划
-
运行您的活动和先决条件的资源
-
必须满足先决条件,然后才能计划活动
-
在管道执行继续时提醒您状态更新的方式
根据您的管道定义, AWS Data Pipeline 确定任务、安排任务并将其分配给任务运行器。如果任务未成功完成,请根据您的说明 AWS Data Pipeline 重试该任务,并在必要时将其重新分配给另一个任务运行器。如果任务反复失败,您可以配置管道通知您。
例如,您可以在管道定义中指定,您的应用程序在 2013 年的每个月生成的日志文件将存档于 Amazon S3 存储桶。然后 AWS Data Pipeline 将创建 12 个任务,每个任务复制一个月的数据,不论该月有 30、31、28 还是 29 天。
您可以通过下列方法之一来创建管道定义:
-
以图形方式使用 AWS Data Pipeline 控制台
-
以文本方式,按命令行界面使用的格式编写 JSON 文件
-
使用 AWS 开发工具包或 AWS Data Pipeline API 以编程方式调用 Web 服务
管道定义可以包含以下类型的组件。
管道组件
有关更多信息,请参阅 管道定义文件语法。