DropNullField를 사용하여 Null 값이 포함된 필드 제거 - AWS Glue

DropNullField를 사용하여 Null 값이 포함된 필드 제거

필드의 모든 값이 'null'인 경우 데이터 집합에서 필드를 제거하려면 DropNullFields 변환을 사용합니다. 기본값으로 AWS Glue Studio는 Null 객체를 인식하지만 빈 문자열, 'null'인 문자열, -1 정수 또는 0과 같은 다른 자리 표시자 등의 일부 값은 자동으로 Null로 인식되지 않습니다.

DropNullFields를 사용하려면
  1. 작업 다이어그램에 DropNullFields 노드를 추가합니다.

  2. 노드 속성(Node properties) 탭에서 Null 값을 나타내는 추가 값을 선택합니다. 값을 선택하지 않거나 모두 선택할 수 있습니다.

    
               스크린샷은 DropNullFields 노드의 변환(Transform) 탭을 보여줍니다.
    • 빈 문자열("" 또는 '') - 빈 문자열이 포함된 필드가 제거됩니다.

    • 'Null 문자열' - 'null'이라는 단어를 포함하는 문자열이 포함된 필드가 제거됩니다.

    • -1 정수 - -1(음수 1) 정수가 포함된 필드가 제거됩니다.

  3. 필요한 경우 사용자 지정 Null 값을 지정할 수도 있습니다. 이러한 Null 값은 해당 데이터 집합에 고유할 수 있습니다. 사용자 지정 Null 값을 추가하려면 새 값 추가(Add new value)를 선택합니다.

  4. 사용자 지정 Null 값을 입력합니다. 예를 들어 0이거나 데이터 집합에서 Null을 나타내는 데 사용되는 임의 값일 수 있습니다.

  5. 드롭다운 필드에서 데이터 유형을 선택합니다. 데이터 유형은 문자열 또는 정수일 수 있습니다.

    참고

    필드가 Null 값으로 인식되고 필드가 제거되려면 사용자 지정 Null 값과 해당 데이터 유형이 정확히 일치해야 합니다. 사용자 지정 null 값만 일치하고 데이터 형식은 일치하지 않는 부분 일치의 경우 필드가 제거되지 않습니다.