NULL 値を持つフィールドを削除するDropNullFields の使用 - AWS Glue Studio

NULL 値を持つフィールドを削除するDropNullFields の使用

フィールド内のすべての値が 'null' の場合、[DropNullFields]transform を使用し、データセットからフィールドを削除します。デフォルトでは、AWS Glue Studio は null オブジェクトを認識しますが、空の文字列、“null”の列、-1 の整数、または 0 などのプレースホルダなどでは、自動的に「null」として認識されません。

DropNullFields を使用するには
  1. ジョブダイアグラムに DropNullFields ノードを追加します。

  2. [Node properties]タブで、NULL 値を表す追加の値を選択します。値を選択しないか、すべての値を選択するかを選択できます。

    
               スクリーンショットは、DropnullFields ノードの Transform tab タブを示しています。
    • 空の文字列("" or '') -空の文字列を含むフィールドは削除されます。

    • "null string"-単語「null」の文字列を含むフィールドは削除されます。

    • a-1 (負の 1) integerを含む-1 整数 - フィールドは削除されます。

  3. 必要に応じて、カスタム NULL 値を指定することもできます。これらは、データセットに一意である可能性がある NULL 値です。カスタム NULL 値を追加するには、[Add new value]を選択します。

  4. カスタム Null 値を入力します。たとえば、ゼロを指定したり、データセット内の NULL を表すために使用されている任意の値を指定できます。

  5. ドロップダウンフィールドでデータタイプを選択します。データ型は、文字列または整数のいずれかです。

    注記

    カスタムの NULL 値とそのデータ型は、フィールドが NULL 値として認識され、フィールドを削除するために、正確に一致する必要があります。カスタムヌル値のみが一致するが、データ型が一致しない部分一致では、フィールドは削除されません。