Présentation des tables, des bases de données et du catalogue de données - Amazon Athena

Si nous fournissons une traduction de la version anglaise du guide, la version anglaise du guide aura préséance en cas de contradiction. La traduction sera une traduction automatique.

Présentation des tables, des bases de données et du catalogue de données

Dans Athena, les tables et les bases de données sont des conteneurs pour les définitions de métadonnées qui définissent un schéma pour les données sources sous-jacentes. Une table doit exister dans Athena pour chaque ensemble de données. Les métadonnées figurant dans cette table indiquent à Athena où les données sont situées dans Amazon S3 et spécifient la structure des données, telle que les noms de colonne, les types de données et le nom de la table. Les bases de données constituent un regroupement logique de tables et stockent uniquement les métadonnées et les informations de schéma pour un ensemble de données.

Pour chaque ensemble de données que vous souhaitez interroger, Athena doit avoir une table sous-jacente qu'il utilisera pour obtenir et renvoyer les résultats de requête. Par conséquent, avant d'exécuter des requêtes sur les données, une table doit être enregistrée dans Athena. L'enregistrement se produit lorsque vous créez des tables automatiquement ou manuellement.

Quelle que soit la façon dont les tables sont créées, le processus de création des tables enregistre l'ensemble de données dans Athena. Cet enregistrement se produit dans le catalogue de données AWS Glue et permet à Athena d'exécuter des requêtes sur les données.

  • Pour créer automatiquement une table, utilisez un robot AWS Glue depuis Athena. Pour plus d'informations sur AWS Glue et les robots, consultez Intégration à AWS Glue. Quand AWS Glue crée une table, il l'enregistre dans son propre AWS Glue Data Catalog. Athena utilise l'AWS Glue Data Catalog pour stocker et récupérer ces métadonnées, et les utiliser lorsque vous exécutez des requêtes pour analyser l'ensemble de données sous-jacent.

Après avoir créé une table, vous pouvez utiliser SÉLECTIONNER SQL pour l’interroger, y compris l’obtention emplacements de fichiers spécifiques pour vos données source. Les résultats de votre requête sont stockés dans Amazon S3 dans l’emplacement du résultat de la requête que vous spécifiez.

L'AWS Glue Data Catalog est accessible dans l'ensemble de votre compte AWS. D'autres services AWS peuvent partager l'AWS Glue Data Catalog, afin que vous puissiez voir les bases de données et les tables créées dans l'ensemble de votre organisation en utilisant Athena et vice versa. En outre, AWS Glue vous permet de découvrir automatiquement les données de schéma et d'extraire, de transformer et de charger (ETL) des données.

  • Pour créer manuellement une table :

    • Utilisez la console Athena pour exécuter l'Assistant de création de table.

    • Utilisez la console Athena pour écrire des instructions DDL Hive dans l'éditeur de requête.

    • Utilisez le Athena de l’API ou de l’interface de ligne de commande pour exécuter une chaîne de requête SQL avec des instructions DDL.

    • Utilisez le pilote JDBC ou ODBC Athena.

Lorsque vous créez manuellement des tables et des bases de données, Athena utilise des instructions DDL (Data Definition Language) HiveQL telles que CREATE TABLE, CREATE DATABASE et DROP TABLE en arrière-plan pour créer des tables et des bases de données dans le catalogue de données AWS Glue.

Note

Dans Athena, si des tables ont été créées avant le 14 août 2017, elles ont été créées dans un catalogue de données interne géré par Athena qui coexiste avec le catalogue de données AWS Glue jusqu'à ce que vous choisissiez de procéder à une mise à jour. Pour plus d'informations, consultez Mise à niveau vers le catalogue de données AWS Glue étape par étape.

Lorsque vous exécutez une requête pour obtenir une table existante, en arrière-plan, Amazon Athena utilise Presto, un moteur SQL distribué. Nous avons des exemples de données dans Athena qui illustrent comment créer une table, puis exécuter une requête sur cette table avec Athena. Athena a également un didacticiel dans la console qui vous permet de commencer la création d'une table en fonction de données stockées dans Amazon S3.

  • Pour consulter un didacticiel étape par étape sur la création d'une table et l'écriture de requêtes dans l'éditeur de requête Athena, consultez Démarrez.

  • Exécutez le didacticiel Athena dans la console. Il se lance automatiquement si vous vous connectez à https://console.aws.amazon.com/athena/ pour la première fois. Vous pouvez également choisir Didacticiel dans la console pour le lancer.