提供您自己的自定义脚本 - AWS Glue

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

提供您自己的自定义脚本

脚本在中执行提取、转换和加载 (ETL) 工作。 AWS Glue当您为作业自动生成源代码逻辑时,将会创建一个脚本。您可以编辑这个生成的脚本,也可以提供您自己的自定义脚本。

要在 AWS Glue 中提供您自己的自定义脚本,请遵循以下常规步骤:
  1. 登录 AWS Management Console 并打开AWS Glue控制台,网址为 https://console.aws.amazon.com/glue/

  2. 选择 ETL 作业选项卡,然后查看创建作业部分。选择脚本编辑器选项。

  3. This job runs 下,选择以下内容之一:

    • 使用样板代码创建新脚本

    • 上传和编辑现有脚本

  4. 作业详细信息页面中,选择运行您的自定义脚本所需的 IAM 角色。有关更多信息,请参阅适用于 AWS Glue 的 Identity and Access Management

  5. 选择您的脚本引用的任何连接。需要这些对象才能连接到必要的 JDBC 数据存储。

    弹性网络接口 (ENI) 是一种虚拟网络接口,您可以将其连接至 Virtual Private Cloud(VPC)中的实例。选择连接到脚本中使用的数据存储所需的弹性网络接口。

  6. 提供特定于您的作业类型的额外配置,包括参数。有关您的作业类型配置的更多信息,请参阅 使用 AWS Glue Studio 构建可视化 ETL 作业 一节。

  7. 脚本选项卡上,粘贴或编写您的自定义脚本。

使用本节中的内容来指导编写自定义脚本的过程。

有关在 AWS Glue 中添加作业的更多信息,请参阅使用 AWS Glue Studio 构建可视化 ETL 作业

有关 step-by-step 指导,请参阅AWS Glue控制台中的添加作业教程。