Utilisation de Modifier le schéma pour remapper les clés de propriétés de données - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de Modifier le schéma pour remapper les clés de propriétés de données

Une transformation Modifier le schéma remet les clés de propriété de données source dans la configuration souhaitée pour les données cibles. Dans un nœud de transformation Modifier le schéma, vous pouvez :

  • Modifiez le nom de plusieurs clés de propriété de données.

  • Modifiez le type de données des clés de propriété de données, si le nouveau type de données est pris en charge et qu'il existe un chemin de transformation entre les deux types de données.

  • Choisir un sous-ensemble de clés de propriété de données en indiquant les clés de propriété de données que vous souhaitez supprimer.

Vous pouvez également ajouter des nœuds Change Schema supplémentaires au diagramme de tâches selon vos besoins, par exemple pour modifier des sources de données supplémentaires ou à la suite d'une transformation de jointure.

Utilisation du schéma de modification avec un type de données décimal

Lorsque vous utilisez la transformation Change Schema avec un type de données décimal, la transformation Change Schema modifie la précision à la valeur par défaut de (10,2). Pour modifier cela et définir la précision adaptée à votre cas d'utilisation, vous pouvez utiliser la transformation de requête SQL et convertir les colonnes avec une précision spécifique.

Par exemple, si vous avez une colonne d'entrée nommée « DecimalCol » de type Décimal et que vous souhaitez la remapper en une colonne de sortie nommée « OutputDecimalCol » avec une précision spécifique de (18,6), vous devez :

  1. Ajoutez une transformation de requête SQL suivante après la transformation de schéma de modification.

  2. Dans la transformation de requête SQL, utilisez une requête SQL pour convertir la colonne remappée avec la précision souhaitée. La requête SQL ressemblerait à ceci :

    SELECT col1, col2, CAST(DecimalCol AS DECIMAL(18,6)) AS OutputDecimalCol FROM __THIS__

    Dans la requête SQL ci-dessus :

    • `col1` et `col2` sont d'autres colonnes de vos données que vous souhaitez transmettre sans modification.

    • `DecimalCol` est le nom de colonne d'origine issu des données d'entrée.

    • `CAST (DecimalCol AS DECIMAL (18,6)) `convertit le` DecimalCol `en un type décimal avec une précision de 18 chiffres et 6 décimales.

    • `AS OutputDecimalCol `renomme la colonne castée en` `. OutputDecimalCol

En utilisant la transformation SQL Query, vous pouvez remplacer la précision par défaut définie par la transformation Change Schema et convertir explicitement les colonnes décimales à la précision souhaitée. Cette approche vous permet de tirer parti de la transformation Change Schema pour renommer et restructurer vos données tout en gérant les exigences de précision pour les colonnes décimales lors de la transformation de requête SQL ultérieure.

Ajouter une transformation Change Schema à votre tâche

Note

La transformation Modifier le schéma n'est pas sensible à la casse.

Pour ajouter un nœud de transformation Modifier le schéma à votre diagramme de tâche
  1. (Facultatif) Ouvrez le panneau Ressources, puis choisissez Modifier le schéma pour ajouter une nouvelle transformation à votre diagramme de tâches, si nécessaire.

  2. Dans le panneau des propriétés du nœud, saisissez un nom pour le nœud dans le diagramme de tâches. Si aucun parent de nœud n'est déjà sélectionné, choisissez un nœud dans la liste de Node parents (Parents de nœud) à utiliser comme source pour la transformation.

  3. Choisissez l'onglet Transformer dans le volet de propriétés du nœud.

  4. Modifiez le schéma d'entrée :

    • Pour renommer une clé de propriété de données, saisissez le nouveau nom de la clé dans le champ Target key (Clé cible).

    • Pour changer le type de données d'une clé de propriété de données, choisissez le nouveau type de données de la clé dans la liste déroulante Data type (Type de données).

    • Pour supprimer une clé de propriété de données du schéma cible, choisissez la case à cocher Drop (Supprimer) pour cette clé.

  5. (Facultatif) Après avoir configuré les propriétés du nœud de transformation, vous pouvez afficher le schéma modifié pour vos données en sélectionnant l'onglet Output Schema (Schéma de sortie) dans le volet de détails du nœud. La première fois que vous choisissez cet onglet pour un nœud de votre tâche, vous êtes invité à fournir un rôle IAM pour accéder aux données. Si vous n'avez pas spécifié de rôle IAM dans le Job détails (Détails de la tâche), vous y êtes invité à ce stade.

  6. (Facultatif) Après avoir configuré les propriétés du nœud et les propriétés de transformation, vous pouvez prévisualiser le jeu de données modifié en sélectionnant l'onglet Prévisualisation des données dans le volet de détails du nœud. La première fois que vous choisissez cet onglet pour un nœud de votre tâche, vous êtes invité à fournir un rôle IAM pour accéder aux données. Il y a un coût associé à l'utilisation de cette fonction, et la facturation commence dès que vous fournissez le rôle IAM.