Uso de DropNullFields para eliminar campos con valores nulos - AWS Glue

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de DropNullFields para eliminar campos con valores nulos

Utilice la transformación DropNullFields para eliminar campos del conjunto de datos si todos los valores son ‘nulos’. De forma predeterminada, AWS Glue Studio reconocerá objetos nulos, pero algunos valores, como cadenas vacías, cadenas que son “nulas”, los enteros -1 u otros marcadores de posición, como ceros, no se reconocen de manera automática como nulos.

Para utilizar DropNullFields
  1. Agregue un nodo DropNullFields al diagrama de trabajo.

  2. En la pestaña Node properties (Propiedades del nodo), elija valores adicionales que representen un valor nulo. Puede elegir seleccionar todos los valores o ninguno:

    La captura de pantalla muestra la pestaña Transform (Transformar) para el nodo DropNullFields.
    • Cadena vacía (“” o “): los campos que contienen cadenas vacías se eliminarán

    • “cadena null”: los campos que contienen la cadena con la palabra ‘null’ se eliminarán

    • entero -1: los campos que contienen un entero -1 (uno negativo) se eliminarán

  3. Si es necesario, también puede especificar valores nulos personalizados. Son valores nulos que pueden ser exclusivos de su conjunto de datos. Para agregar un valor nulo personalizado, elija Add new value (Agregar un nuevo valor).

  4. Ingrese el valor nulo personalizado. Por ejemplo, puede ser cero o cualquier valor que se utilice para representar un valor nulo en el conjunto de datos.

  5. Elija el tipo de datos en el campo desplegable. Los tipos de datos pueden ser String o Integer.

    nota

    Los valores nulos personalizados y los tipos de datos deben coincidir con exactitud para que los campos se reconozcan como valores nulos y se eliminen. Las coincidencias parciales en las que solo coincide el valor nulo personalizado, pero el tipo de datos no lo hace, no provocarán que los campos se eliminen.