Consulta de dados do S3 Express One Zone - Amazon Athena

Consulta de dados do S3 Express One Zone

A classe de armazenamento Amazon S3 Express One Zone é uma classe de armazenamento do Amazon S3 com alta performance que fornece tempos de resposta abaixo de dez milissegundos. Dessa forma, essa classe é útil para aplicações que acessam dados frequentemente com centenas de milhares de solicitações por segundo.

A classe S3 Express One Zone replica e armazena dados na mesma zona de disponibilidade para otimizar a velocidade e os custos. Isso difere das classes de armazenamento regionais do Amazon S3, que replicam automaticamente os dados em, no mínimo, três zonas de disponibilidade da AWS em uma Região da AWS.

Para obter mais informações, consulte What is S3 Express One Zone? no Guia do usuário do Amazon S3.

Pré-requisitos

Confirme se as seguintes condições foram atendidas antes de começar a usar:

  • Versão 3 do mecanismo Athena: para usar a classe S3 Express One Zone com o Athena SQL, o grupo de trabalho deve estar configurado para usar a versão 3 do mecanismo Athena.

  • Permissões do S3 Express One Zone: quando a classe S3 Express One Zone chama uma ação como GET, LIST ou PUT em um objeto do Amazon S3, a classe de armazenamento chama CreateSession em seu nome. Por esse motivo, a política do IAM deve permitir a ação s3express:CreateSession, que possibilita ao Athena invocar a operação de API correspondente.

Considerações e limitações

Ao consultar a classe S3 Express One Zone com o Athena, considere os pontos apresentados a seguir.

  • Os buckets da classe S3 Express One Zone oferecem suporte somente à criptografia SSE_S3. Os resultados da consulta do Athena são gravados usando a criptografia SSE_S3, independentemente da opção escolhida por você nas configurações do grupo de trabalho para criptografar os resultados da consulta. Essa limitação inclui todos os cenários em que o Athena grava dados em buckets da classe S3 Express One Zone, incluindo instruções CREATE TABLE AS (CTAS) e INSERT INTO.

  • Não há suporte para o crawler do AWS Glue para a criação de tabelas em dados do S3 Express One Zone.

  • Não há suporte para a instrução MSCK REPAIR TABLE. Como solução alternativa, use ALTER TABLE ADD PARTITION.

  • ALTER TABLE ADD PARTITION, ALTER TABLE DROP PARTITION e ALTER TABLE RENAME PARTITION não são compatíveis com tabelas Iceberg no S3 Express One Zone.

  • Não há suporte ou o suporte é limitado para os formatos de arquivos e de tabelas apresentados a seguir. Se os formatos não estiverem listados, mas forem compatíveis com o Athena (como Parquet, ORC e JSON), eles também terão suporte para uso com o armazenamento do S3 Express One Zone.

    Formato de arquivo ou de tabela Limitação
    Apache Avro Sem compatibilidade
    Logs do CloudTrail Sem compatibilidade
    Apache Hudi Sem compatibilidade
    Amazon Ion Sem compatibilidade
    Logs do Logstash Sem compatibilidade
    Logs do Apache WebServer Sem compatibilidade
    Delta Lake Não há suporte para DDL. Para obter informações sobre como criar uma tabela do Delta Lake usando um esquema fictício, consulte Sincronização de metadados do Delta Lake. Há suporte para consultas SELECT na tabela.

Conceitos básicos

Consultar dados da classe S3 Express One Zone com o Athena é simples. Para começar a usar, siga o procedimento apresentado a seguir.

Como usar o Athena SQL para consultar dados da classe S3 Express One Zone
  1. Faça a transição dos seus dados para o armazenamento do S3 Express One Zone. Para obter mais informações, consulte Configurar a classe de armazenamento de um objeto no Guia do usuário do Amazon S3.

  2. Use uma instrução CREATE TABLE no Athena para catalogar seus dados no AWS Glue Data Catalog. Para obter informações sobre como criar tabelas no Athena, consulte Criar tabelas no Athena e a instrução CREATE TABLE.

  3. (Opcional) Configure a localização do resultado da consulta do grupo de trabalho do Athena para usar um bucket de diretório do Amazon S3. Os buckets de diretório do Amazon S3 têm uma performance aprimorada quando comparados aos buckets gerais e são projetados para workloads ou aplicações críticas à performance que requerem latência consistente abaixo de dez milissegundos. Para obter mais informações, consulte Directory buckets overview no Guia do usuário do Amazon S3.