Création d'un nœud de source Amazon Redshift - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d'un nœud de source Amazon Redshift

Autorisations nécessaires

Les tâches AWS Glue Studio utilisant les sources de données Amazon Redshift nécessitent des autorisations supplémentaires. Pour plus d'informations sur la façon d'ajouter des autorisations aux tâches ETL, consultez Review IAM permissions needed for ETL jobs.

Les autorisations suivantes sont nécessaires pour utiliser une connexion Amazon Redshift.

  • redshift-data:ListSchemas

  • redshift-data:ListTables

  • redshift-data:DescribeTable

  • redshift-data:ExecuteStatement

  • redshift-data:DescribeStatement

  • redshift-data:GetStatementResult

Ajout d'une source de données Amazon Redshift

Pour ajouter un nœud Source de données – Amazon Redshift :
  1. Choisissez le type d'accès Amazon Redshift :

    • Connexion directe aux données (recommandée) : choisissez cette option si vous souhaitez accéder directement à vos données Amazon Redshift. Il s'agit de l'option recommandée, mais également de l'option par défaut.

    • Data Catalog tables : choisissez cette option si vous souhaitez utiliser des tables du catalogue de données.

  2. Si vous choisissez Connexion directe aux données, choisissez la connexion pour votre source de données Amazon Redshift. Cela suppose que la connexion existe déjà et que vous pouvez la sélectionner parmi les connexions existantes. Si vous devez créer une connexion, choisissez Créer une connexion Redshift. Pour en savoir plus, consultez Overview of using connectors and connections .

    Une fois que vous avez choisi une connexion, vous pouvez afficher ses propriétés en cliquant sur Afficher les propriétés. Les informations relatives à la connexion sont visibles, notamment l'URL, les groupes de sécurité, le sous-réseau, la zone de disponibilité, la description et les horodatages de création (UTC) et de dernière mise à jour (UTC).

  3. Choisissez une option de source Amazon Redshift :

    • Choisir une seule table : il s'agit de la table qui contient les données auxquelles vous souhaitez accéder à partir d'une seule table Amazon Redshift.

    • Saisir une requête personnalisée : vous permet d'accéder à un jeu de données à partir de plusieurs tables Amazon Redshift en fonction de votre requête personnalisée.

  4. Si vous avez choisi une seule table, choisissez le schéma Amazon Redshift. La liste des schémas disponibles parmi lesquels choisir est déterminée par la table sélectionnée.

    Vous pouvez également choisir Saisir une requête personnalisée. Choisissez cette option pour accéder à un jeu de données personnalisé à partir de plusieurs tables Amazon Redshift. Lorsque vous choisissez cette option, saisissez la requête Amazon Redshift.

    Lorsque vous vous connectez à un environnement Amazon Redshift sans serveur, ajoutez l'autorisation suivante à la requête personnalisée :

    GRANT SELECT ON ALL TABLES IN <schema> TO PUBLIC

    Vous pouvez choisir Déduire un schéma pour lire le schéma en fonction de la requête que vous avez saisie. Vous pouvez également choisir Ouvrir l'éditeur de requêtes Redshift pour saisir une requête Amazon Redshift. Pour plus d'informations, consultez Interrogation d'une base de données à l'aide de l'éditeur de requête.

  5. Dans Performances et sécurité, choisissez le répertoire intermédiaire Amazon S3 et le rôle IAM.

    • Répertoire intermédiaire Amazon S3 : choisissez l'emplacement Amazon S3 pour les données intermédiaires temporaires.

    • Rôle IAM : choisissez le rôle IAM qui peut écrire sur l'emplacement Amazon S3 que vous avez sélectionné.

  6. Dans Paramètres Redshift personnalisés – facultatif, saisissez le paramètre et la valeur.