Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Interrogation du AWS Glue Data Catalog
Vous pouvez utiliser l'éditeur de requêtes v2 pour interroger les données cataloguées dans votre AWS Glue Data Catalog en utilisant des SQL commandes spécifiques et en accordant les autorisations décrites dans cette section. Par défaut, le AWS Glue Data Catalog
est répertorié sous la forme d'une base de données d'éditeur de requêtes v2 nomméeawsdatacatalog
. Interrogation du AWS Glue Data Catalog
n'est pas disponible dans tous les Amazon Redshift Régions AWS. Utilisez la SHOW commande pour déterminer si cette fonctionnalité est disponible. Pour plus d'informations sur AWS Glue, voir Qu'est-ce que AWS Glue? dans le AWS Glue Guide du développeur.
Note
Interrogation du AWS Glue Data Catalog est uniquement pris en charge dans les clusters de type RA3 nœud Amazon Redshift et Amazon Redshift Serverless.
Vous pouvez configurer votre entrepôt de données et consulter AWS Glue objets de base de données catalogués à l'aide des SQL commandes suivantes :
-
SHOW— pour indiquer s'il
awsdatacatalog
est monté pour l'entrepôt de données actuellement connecté. Par exemple, pour afficher la valeur du paramètredata_catalog_auto_mount
, exécutez :SHOW data_catalog_auto_mount;
Pour plus d'informations, consultez le SHOWmanuel Amazon Redshift Database Developer Guide.
-
ALTERSYSTEM— pour modifier la configuration au niveau du système de.
data_catalog_auto_mount
Par exemple, pour faire passer la valeur du paramètredata_catalog_auto_mount
àon
, exécutez :ALTER SYSTEM SET data_catalog_auto_mount = on;
La modification prend effet lorsqu'un cluster provisionné est redémarré ou que l'activité d'un groupe de travail sans serveur est automatiquement suspendue puis reprise. Pour plus d'informations, consultez le ALTERSYSTEMmanuel Amazon Redshift Database Developer Guide.
-
SHOWSCHEMAS— affiche une liste de schémas. Les schémas de la base de données nommée
awsdatacatalog
représentent AWS Glue bases de données cataloguées dans AWS Glue Data Catalog. Par exemple, pour afficher ces schémas, exécutez :SHOW SCHEMAS FROM DATABASE awsdatacatalog;
Pour plus d'informations, consultez le SHOWSCHEMASmanuel Amazon Redshift Database Developer Guide.
-
SHOWTABLES— affiche la liste des tables d'un schéma. Par exemple, pour afficher les tableaux du AWS Glue Data Catalog bases de données nommées
awsdatacatalog
qui sontmyglue
exécutées dans le schéma :SHOW TABLES FROM SCHEMA awsdatacatalog.myschema;
Pour plus d'informations, consultez le SHOWTABLESmanuel Amazon Redshift Database Developer Guide.
-
SHOWCOLUMNS— affiche la liste des colonnes d'un tableau. Par exemple, pour afficher les colonnes du AWS Glue Data Catalog noms de base
awsdatacatalog
de données figurant dans le schémamyglue
et la tablemytable
exécutés :SHOW COLUMNS FROM TABLE awsdatacatalog.myglue.mytable;
Pour plus d'informations, consultez le SHOWCOLUMNSmanuel Amazon Redshift Database Developer Guide.
Pour accorder à votre IAM utilisateur ou à votre rôle l'autorisation d'interroger le AWS Glue Data Catalog,
-
Dans le volet d'arborescence, connectez-vous à votre base de données initiale dans votre cluster provisionné ou votre groupe de travail sans serveur en utilisant la méthode d'authentification Nom d'utilisateur et mot de passe de la base de données. Par exemple, connectez-vous à la base de données
dev
en utilisant le nom d'utilisateur et le mot de passe d'administrateur que vous avez utilisés au moment de créer le cluster ou le groupe de travail. -
Dans un onglet de l'éditeur, exécutez l'SQLinstruction suivante pour accorder à un IAM utilisateur l'accès au AWS Glue Data Catalog.
GRANT USAGE ON DATABASE awsdatacatalog to "
IAM:myIAMUser
"Où
IAM:myIAMUser
est un IAM utilisateur à qui vous souhaitez accorder des privilèges d'utilisation à AWS Glue Data Catalog. Vous pouvez également accorder des privilèges d'utilisation àIAMR:myIAMRole
pour un IAM rôle. -
Dans le volet d'arborescence, modifiez ou supprimez la connexion au cluster ou groupe de travail que vous avez créé précédemment. Connectez-vous à votre cluster ou groupe de travail de l'une des manières suivantes :
-
Pour accéder à la
awsdatacatalog
base de données depuis un cluster, vous devez utiliser la méthode d'authentification Informations d'identification temporaires utilisant votre IAM identité. Pour en savoir plus sur cette méthode d'authentification, consultez Connexion à une base de données Amazon Redshift. Votre administrateur de l'éditeur de requête v2 devra peut-être configurer les Paramètres du compte pour que le compte affiche cette méthode d'authentification dans la fenêtre de connexion. -
Pour accéder à la base de données
awsdatacatalog
à partir d'un groupe de travail, vous devez utiliser la méthode d'authentification Utilisateur fédéré. Pour en savoir plus sur cette méthode d'authentification, consultez Connexion à une base de données Amazon Redshift.
-
-
Avec le privilège accordé, vous pouvez utiliser votre IAM identité pour vous SQL opposer à votre AWS Glue Data Catalog.
Après la connexion, vous pouvez utiliser l'éditeur de requêtes v2 pour interroger les données cataloguées dans AWS Glue Data Catalog. Dans le volet d'arborescence de l'éditeur de requêtes v2, choisissez le cluster ou le groupe de travail et la base de données. awsdatacatalog
Dans le volet de l'éditeur ou du bloc-notes, vérifiez que le cluster ou le groupe de travail approprié est sélectionné. La base de données choisie doit être la base de données Amazon Redshift initiale, comme dev
. Pour en savoir plus sur la création de requêtes, consultez Création de requêtes avec Amazon Redshift et Carnets de notes dans Amazon Redshift. La base de données nommée awsdatacatalog
est réservée pour référencer la base de données du catalogue de données externe dans votre compte. Les requêtes exécutées sur la base de données awsdatacatalog
peuvent être uniquement en lecture seule. Utilisez une notation en trois parties pour faire référence au tableau dans votre SELECT relevé. Où la première partie est le nom de la base de données, la deuxième partie est AWS Glue nom de la base de données, et la troisième partie est AWS Glue nom de la table.
SELECT * FROM awsdatacatalog.
<aws-glue-db-name
>.<aws-glue-table-name
>;
Vous pouvez exécuter différents scénarios qui se lisent comme suit AWS Glue Data Catalog données et renseignez les tables Amazon Redshift.
L'exemple suivant SQL joint deux tables définies dans AWS Glue.
SELECT pn.emp_id, alias, role, project_name FROM "awsdatacatalog"."empl_db"."project_name_table" pn, "awsdatacatalog"."empl_db"."project_alias_table" pa WHERE pn.emp_id = pa.emp_id;
L'exemple suivant SQL crée une table Amazon Redshift et la remplit avec des données issues d'une jointure de deux AWS Glue tables.
CREATE TABLE dev.public.glue AS SELECT pn.emp_id, alias, role, project_name FROM "awsdatacatalog"."empl_db"."project_name_table" pn, "awsdatacatalog"."empl_db"."project_alias_table" pa WHERE pn.emp_id = pa.emp_id;