Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Autorisations nécessaires
AWS Glue Studio les tâches utilisant Amazon Redshift des sources de données nécessitent des autorisations supplémentaires. Pour plus d'informations sur la façon d'ajouter des autorisations aux tâches ETL, consultez Review IAM permissions needed for ETL jobs.
Les autorisations suivantes sont nécessaires pour utiliser une Amazon Redshift connexion.
-
données redshift : ListSchemas
-
données redshift : ListTables
-
données redshift : DescribeTable
-
données redshift : ExecuteStatement
-
données redshift : DescribeStatement
-
données redshift : GetStatementResult
Ajouter une source Amazon Redshift de données
Pour ajouter un nœud Source de données – Amazon Redshift :
-
Choisissez le type Amazon Redshift d'accès :
-
Connexion directe aux données (recommandée) : choisissez cette option si vous souhaitez accéder directement à vos données Amazon Redshift . Il s'agit de l'option recommandée, mais également de l'option par défaut.
-
Data Catalog tables — choisissez cette option si vous souhaitez utiliser des tables du catalogue de données.
-
-
Si vous choisissez Connexion directe aux données, choisissez la connexion pour votre source de Amazon Redshift données. Cela suppose que la connexion existe déjà et que vous pouvez la sélectionner parmi les connexions existantes. Si vous devez créer une connexion, choisissez Créer une connexion Redshift. Pour en savoir plus, consultez Overview of using connectors and connections .
Une fois que vous avez choisi une connexion, vous pouvez afficher ses propriétés en cliquant sur Afficher les propriétés. Les informations relatives à la connexion sont visibles, notamment l'URL, les groupes de sécurité, le sous-réseau, la zone de disponibilité, la description et les horodatages de création (UTC) et de dernière mise à jour (UTC).
-
Choisissez une option Amazon Redshift de source :
-
Choisissez une seule table : il s'agit de la table qui contient les données auxquelles vous souhaitez accéder à partir d'une seule Amazon Redshift table.
-
Saisir une requête personnalisée : vous permet d'accéder à un jeu de données à partir de plusieurs tables Amazon Redshift en fonction de votre requête personnalisée.
-
-
Si vous avez choisi une seule table, choisissez le Amazon Redshift schéma. La liste des schémas disponibles parmi lesquels choisir est déterminée par la table sélectionnée.
Vous pouvez également choisir Saisir une requête personnalisée. Choisissez cette option pour accéder à un jeu de données personnalisé à partir de plusieurs tables Amazon Redshift . Lorsque vous choisissez cette option, entrez la Amazon Redshift requête.
Lorsque vous vous connectez à un environnement Amazon Redshift sans serveur, ajoutez l'autorisation suivante à la requête personnalisée :
GRANT SELECT ON ALL TABLES IN <schema> TO PUBLIC
Vous pouvez choisir Déduire un schéma pour lire le schéma en fonction de la requête que vous avez saisie. Vous pouvez également choisir l'éditeur de requêtes Open Redshift pour saisir une Amazon Redshift requête. Pour plus d'informations, consultez Interrogation d'une base de données à l'aide de l'éditeur de requête.
-
Dans Performances et sécurité, choisissez le répertoire intermédiaire Amazon S3 et le rôle IAM.
-
Répertoire intermédiaire Amazon S3 : choisissez l'emplacement Amazon S3 pour les données intermédiaires temporaires.
-
Rôle IAM : choisissez le rôle IAM qui peut écrire sur l'emplacement Amazon S3 que vous avez sélectionné.
-
-
Dans Paramètres Redshift personnalisés – facultatif, saisissez le paramètre et la valeur.