使用 DropNullFields 刪除具有空值的欄位 - AWS 連接詞

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 DropNullFields 刪除具有空值的欄位

如果欄位中的所有值都為 ‘null’,使用 DropNullFields 轉換以從資料集中刪除此欄位。依預設,AWS Glue Studio 將識別空物件,但某些值,如空字串、值為 “null” 的字串、-1 整數或其他預留位置 (如零) 不會自動識別為空值。

使用 DropNullFields
  1. 新增一個 DropNullFields 節點到任務圖表。

  2. 節點屬性索引標籤上,選擇代表空值的其他值。您可以選擇不選取任何值或選取所有值:

    螢幕擷取畫面顯示 DropNullFields 節點的「轉換」索引標籤。
    • 空字串 ("" 或 '') – 包含空字串的欄位將被刪除

    • "null string" – 包含帶有字 'null' 的字串的欄位將被刪除

    • -1 整數 – 包含 -1 整數的欄位將被刪除

  3. 如果需要,您也可以指定自訂空值。這些是資料集中可能唯一的空值。若要新增自訂空值,請選擇新增值

  4. 輸入自訂空值。例如,這可以為 0,或用來表示資料集中之 null 的任何值。

  5. 在下拉式清單欄位中選擇資料類型。資料類型可以是字串或整數。

    注意

    自訂空值及其資料類型必須完全相符,才能將欄位識別為空值並移除此欄位。部分相符,其中只有自訂 Null 值相符,但資料類型不會導致移除欄位。