Utilisation de DropNullFields pour supprimer des champs avec des valeurs null - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de DropNullFields pour supprimer des champs avec des valeurs null

Utilisation de la transformation DropNullFields pour supprimer des champs du jeu de données si toutes les valeurs du champ sont « null ». Par défaut, AWS Glue Studio reconnaîtra les objets null, mais certaines valeurs telles que des chaînes vides, des chaînes « null », des entiers -1 ou d'autres valeurs de remplacement tels que des zéros ne sont pas automatiquement reconnues comme null.

Pour utiliser DropNullFields
  1. Ajoutez un nœud DropNullFields au diagramme de tâches.

  2. Dans la page Node properties (Propriétés de nœud), choisissez des valeurs supplémentaires qui représentent une valeur null. Vous pouvez choisir de sélectionner aucune valeur ou la totalité des valeurs :

    La capture d'écran montre l'onglet Transformation pour le nœud DropNullFields.
    • Chaîne vide («» ou '') – les champs contenant des chaînes vides seront supprimés

    • « Chaîne null » – les champs contenant la chaîne avec le mot « null » seront supprimés

    • Entier -1 – les champs contenant un entier -1 (un négatif) seront supprimés

  3. Au besoin, vous pouvez également spécifier des valeurs null personnalisées. Il s'agit de valeurs null qui peuvent être uniques à votre jeu de données. Pour ajouter une valeur null personnalisée, choisissez Add new value (Ajouter une nouvelle valeur).

  4. Entrez la valeur null personnalisée. Par exemple, il peut s'agir de zéro ou de toute valeur utilisée pour représenter une valeur null dans le jeu de données.

  5. Choisissez le type de données dans le champ déroulant. Les types de données peuvent être soit des chaînes, soit des nombres entiers.

    Note

    Les valeurs null personnalisées et leurs types de données doivent correspondre exactement pour que les champs soient reconnus comme des valeurs null et que les champs soient supprimés. Les correspondances partielles où seule la valeur null personnalisée correspond, mais pas le type de données, n'entraîneront pas la suppression des champs.