識別子列を追加する - AWS Glue

識別子列を追加する

データセット内の各行に数値識別子を割り当てます。

ジョブ図に識別子変換ノードを追加するには
  1. リソースパネルを開いて、[Identifier] を選択し、ジョブ図に新しい変換を追加します。ノードを追加する際に選択したノードが、その親になります。

  2. (オプション) [Node properties] (ノードのプロパティ) タブで、ジョブ図にノードの名前を入力できます。ノードの親がまだ選択されていない場合は、[Node parents] (ノードの親) リストから、変換の入力ソースとして使用するノードを選択します。

  3. (オプション) 新しい列の名前は [Transform] (変換) タブでカスタマイズできます。デフォルトでは、「id」という名前が付けられます。

  4. (オプション) ジョブがデータを段階的に処理して保存する場合は、ジョブの実行時に同じ ID が再利用されないよう注意する必要があります。

    [Transform] (変換) タブで、チェックボックスのオプション [unique] (一意) をチェックします。これで識別子にジョブのタイムスタンプが追加されるため、複数の実行間で一意になります。数字を増やせるようにするには、long の代わりに列を 10 進数にします。