添加标识符列 - AWS Glue

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

添加标识符列

为数据集中的每一行分配一个数字标识符

在任务图中添加标识符转换节点
  1. 打开资源面板,然后选择标识符将新转换添加到作业图。添加节点时选择的节点将是其父节点。

  2. (可选)在节点属性选项卡上,输入任务图中节点的名称。如果尚未选择父节点,请从 Node parents (父节点) 列表中选择一个节点,用作转换的输入源。

  3. (可选)在转换选项卡上,您可以自定义新列的名称。默认情况下,将被命名为“id”。

  4. (可选)如果作业以增量方式处理和存储数据,则要避免在两次作业运行之间重复使用相同的 id。

    转换选项卡上,勾选复选框选项唯一。标识符中会包含作业时间戳,使标识符在多次运行之间是唯一的。为了允许较大的数字,列(而不是 Long 数据类型)将为十进制。