Interrogez le AWS Glue Data Catalog - Amazon Athena

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Interrogez le AWS Glue Data Catalog

Étant donné qu' AWS Glue Data Catalog il est utilisé par de nombreuses personnes Services AWS comme référentiel central de métadonnées, vous souhaiterez peut-être interroger les métadonnées du catalogue de données. Pour ce faire, vous pouvez utiliser des SQL requêtes dans Athena. Vous pouvez utiliser Athena pour interroger les métadonnées du AWS Glue catalogue telles que les bases de données, les tables, les partitions et les colonnes.

Pour obtenir les métadonnées du AWS Glue catalogue, vous devez interroger la information_schema base de données sur le backend Athena. Les exemples de requête de cette rubrique montrent comment utiliser Athena pour interroger les métadonnées du catalogue AWS Glue pour les cas d'utilisation courants.

Considérations et restrictions

  • Au lieu d'interroger la information_schema base de données, il est possible d'utiliser des DDLcommandes Apache Hive individuelles pour extraire d'Athena des informations de métadonnées pour des bases de données, des tables, des vues, des partitions et des colonnes spécifiques. Toutefois, le résultat est dans un format non tabulaire.

  • Les requêtes information_schema sont plus performantes si vous disposez d'une quantité faible à modérée de AWS Glue métadonnées. Si vous disposez d'un grand nombre de métadonnées, des erreurs peuvent se produire.

  • Vous ne pouvez pas utiliser CREATE VIEW pour créer une vue sur la base de données information_schema.