Interrogation des données de S3 Express One Zone - Amazon Athena

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Interrogation des données de S3 Express One Zone

La classe de stockage Amazon S3 Express One Zone est une classe de stockage Amazon S3 très performante qui fournit des temps de réponse de l’ordre de la milliseconde. En tant que tel, il est utile pour les applications qui accèdent fréquemment aux données avec des centaines de milliers de requêtes par seconde.

S3 Express One Zone réplique et stocke les données au sein de la même zone de disponibilité afin d’optimiser la vitesse et les coûts. Cela diffère des classes de stockage régionales Amazon S3, qui répliquent automatiquement les données sur au moins trois zones de AWS disponibilité au sein d'un Région AWS.

Pour plus d’informations, veuillez consulter What is S3 Express One Zone? dans le Guide de l’utilisateur Amazon S3.

Prérequis

Vérifiez que les conditions suivantes sont réunies avant de commencer :

  • Moteur Athena version 3 : pour utiliser S3 Express One Zone avec Athena SQL, votre groupe de travail doit être configuré pour utiliser le moteur Athena version 3.

  • Autorisations S3 Express One Zone : lorsque S3 Express One Zone appelle une action telle que GET, LIST ou PUT sur un objet Amazon S3, la classe de stockage appelle CreateSession en votre nom. Pour cette raison, votre politique IAM doit autoriser l’action s3express:CreateSession, qui permet à Athena d’invoquer l’opération d’API correspondante.

Considérations et restrictions

Lorsque vous interrogez S3 Express One Zone avec Athena, tenez compte des points suivants.

  • Les compartiments S3 Express One Zone ne prennent en charge que le chiffrement SSE_S3. Les résultats des requêtes Athena sont écrits à l’aide du chiffrement SSE_S3, quelle que soit l’option que vous avez choisie dans les paramètres du groupe de travail pour chiffrer les résultats des requêtes. Cette limitation inclut tous les scénarios dans lesquels Athena écrit des données dans des compartiments S3 Express One Zone, y compris les instructions CREATE TABLE AS (CTAS) et INSERT INTO.

  • Le AWS Glue robot d'exploration n'est pas pris en charge pour créer des tables sur les données S3 Express One Zone.

  • L’instruction MSCK REPAIR TABLE n’est pas prise en charge. Comme solution de contournement, utilisez ALTER TABLE ADD PARTITION.

  • ALTER TABLE ADD PARTITIONALTER TABLE DROP PARTITION, et ne ALTER TABLE RENAME PARTITION sont pas pris en charge pour les tables Iceberg dans S3 Express One Zone.

  • Les formats de fichiers et de tables suivants ne sont pas pris en charge ou sont pris en charge de manière limitée. Si des formats ne sont pas répertoriés, mais qu’ils sont pris en charge par Athena (comme Parquet, ORC et JSON), ils sont également pris en charge avec le stockage S3 Express One Zone.

    Format de fichier ou de table Limitation
    Apache Avro Non pris en charge
    CloudTrail journaux Non pris en charge
    Apache Hudi Non pris en charge
    Amazon Ion Non pris en charge
    Journaux Logstash Non pris en charge
    WebServer Journaux Apache Non pris en charge
    Delta Lake DDL non prise en charge. Pour plus d’informations sur la création d’une table Delta Lake à l’aide d’un schéma factice, consultez Synchronisation des métadonnées Delta Lake. Les requêtes SELECT sur la table sont prises en charge.

Premiers pas

L’interrogation des données S3 Express One Zone avec Athena est simple. Pour démarrer, suivez la procédure ci-dessous.

Pour utiliser Athena SQL afin d’interroger les données S3 Express One Zone
  1. Transférez vos données vers le stockage S3 Express One Zone. Pour de plus amples informations, consultez la rubrique Définition de la classe de stockage d’un objet dans le Guide de l’utilisateur Amazon S3.

  2. Utilisez une instruction CREATE TABLE dans Athena pour cataloguer vos données dans AWS Glue Data Catalog. Pour plus d’informations sur la création des tables dans Athena, consultez Création de tables dans Athena et l’instruction CREATE TABLE.

  3. (Facultatif) Configurez l’emplacement des résultats de requête de votre groupe de travail Athena pour utiliser un compartiment de répertoire Amazon S3. Les compartiments de répertoire Amazon S3 sont plus performants que les compartiments généraux et sont conçus pour les charges de travail ou les applications critiques en termes de performances qui nécessitent une latence constante de l’ordre de la milliseconde. Pour plus d’informations, consultez la rubrique Directory buckets overview dans le Guide de l’utilisateur Amazon S3.