Interrogation de tables de métadonnées à l'aide de services AWS d'analyse - Amazon Simple Storage Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Interrogation de tables de métadonnées à l'aide de services AWS d'analyse

Vous pouvez interroger vos tables de métadonnées gérées par S3 à l'aide de services AWS d'analyse tels qu'Amazon Athena, Amazon Redshift et Amazon EMR.

Avant de pouvoir exécuter des requêtes, vous devez d'abord intégrer les compartiments de tables S3 AWS gérés dans votre région Compte AWS et dans les services d' AWS analyse.

Interrogation des tables de métadonnées avec Amazon Athena

Après avoir intégré vos compartiments de tables S3 AWS gérés aux services AWS d'analyse, vous pouvez commencer à interroger vos tables de métadonnées dans Athena. Dans vos requêtes, procédez comme suit :

  • Spécifiez votre catalogue comme s3tablescatalog/aws-s3 et votre base de données comme b_general_purpose_bucket_name (qui est généralement l'espace de noms de vos tables de métadonnées).

  • Assurez-vous d'entourer les noms des espaces de noms de vos tables de métadonnées entre guillemets (") ou backticks (`), sinon la requête risque de ne pas fonctionner.

Pour plus d’informations, consultez Interrogation des tables Amazon S3 avec Athena.

Vous pouvez également exécuter des requêtes dans Athena depuis la console Amazon S3.

La procédure suivante utilise la console Amazon S3 pour accéder à l'éditeur de requêtes Athena afin que vous puissiez interroger une table avec Amazon Athena.

Pour interroger une table de métadonnées
  1. Connectez-vous à la console Amazon S3 AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/s3/.

  2. Dans le volet de navigation de gauche, choisissez Compartiments à usage général.

  3. Dans l'onglet Compartiments à usage général, choisissez le compartiment contenant la configuration des métadonnées pour la table de métadonnées que vous souhaitez interroger.

  4. Sur la page des détails du bucket, choisissez l'onglet Metadata.

  5. Choisissez Table de requêtes avec Athena, puis choisissez l'un des exemples de requêtes pour les tables de journal ou d'inventaire.

  6. La console Amazon Athena s'ouvre et l'éditeur de requêtes Athena apparaît avec un exemple de requête chargé pour vous. Modifiez cette requête selon les besoins de votre cas d'utilisation.

    Dans l'éditeur de requêtes, le champ Catalogue doit être renseigné avec s3tablescatalog/aws-s3. Le champ Base de données doit être renseigné avec l'espace de noms dans lequel votre table est stockée (par exemple, b_ general-purpose-bucket-name).

    Note

    Si vous ne voyez pas ces valeurs dans les champs Catalogue et Base de données, assurez-vous d'avoir intégré votre compartiment de tables AWS géré aux services AWS d'analyse de cette région. Pour de plus amples informations, veuillez consulter Intégration des tables Amazon S3 aux services AWS d'analyse.

  7. Pour exécuter la requête, choisissez ensuite Run (Exécuter).

    Note
    • Si vous recevez le message d'erreur « Autorisations insuffisantes pour exécuter la requête. Le principal n'a aucun privilège sur la ressource spécifiée. » Lorsque vous essayez d'exécuter une requête dans Athena, vous devez obtenir les autorisations Lake Formation nécessaires sur la table. Pour de plus amples informations, veuillez consulter Octroi de l'autorisation Lake Formation sur une table ou une base de données.

      Assurez-vous également que vous disposez des autorisations AWS Identity and Access Management (IAM) appropriées pour interroger les tables de métadonnées. Pour de plus amples informations, veuillez consulter Autorisations pour interroger les tables de métadonnées.

    • Si le message d'erreur « Iceberg ne peut pas accéder à la ressource demandée » s'affiche lorsque vous essayez d'exécuter la requête, accédez à la AWS Lake Formation console et assurez-vous que vous vous êtes accordé des autorisations sur le catalogue de compartiments de tables et la base de données (espace de noms) que vous avez créés. Ne spécifiez pas de table lorsque vous accordez ces autorisations. Pour de plus amples informations, veuillez consulter Octroi de l'autorisation Lake Formation sur une table ou une base de données.

Interrogation des tables de métadonnées avec Amazon Redshift

Après avoir intégré vos compartiments de tables S3 AWS gérés aux services AWS d'analyse, procédez comme suit :

  • Créez un lien de ressource vers l'espace de noms de votre table de métadonnées (généralementb_general_purpose_bucket_name).

  • Assurez-vous d'entourer les noms des espaces de noms de vos tables de métadonnées entre guillemets (") ou backticks (`), sinon la requête risque de ne pas fonctionner.

Une fois cela fait, vous pouvez commencer à interroger vos tables de métadonnées dans la console Amazon Redshift. Pour plus d’informations, consultez Accès aux tables Amazon S3 avec Amazon Redshift.

Interrogation des tables de métadonnées avec Amazon EMR

Pour interroger vos tables de métadonnées à l'aide d'Amazon EMR, vous devez créer un cluster Amazon EMR configuré pour vos tables de métadonnées Apache Iceberg et vous y connecter à l'aide de. Apache Spark Vous pouvez configurer cela en intégrant vos compartiments de tables S3 AWS gérés à des services d' AWS analyse ou en utilisant le catalogue de tables Amazon S3 open source pour le catalogue Iceberg client.

Note

Lorsque vous utilisez Apache Spark Amazon EMR ou d'autres moteurs tiers pour interroger vos tables de métadonnées, nous vous recommandons d'utiliser le point de terminaison Iceberg REST Amazon S3 Tables. Votre requête risque de ne pas s'exécuter correctement si vous n'utilisez pas ce point de terminaison. Pour de plus amples informations, veuillez consulter Accès aux tables à l'aide des tables Amazon S3 Iceberg REST point de terminaison.

Pour plus d’informations, consultez Accès aux tables Amazon S3 avec Amazon EMR.