Tipos de dados suportados para tabelas Iceberg no Athena

Apache Iceberg tabelas em AWS Clean Rooms

Apache Iceberg é um formato de tabela de código aberto para data lakes. AWS Clean Rooms pode usar as estatísticas armazenadas em Apache Iceberg metadados para otimizar os planos de consulta e reduzir as varreduras de arquivos durante o processamento de consultas em sala limpa. Para obter mais informações, consulte na documentação do Apache Iceberg.

Considere o seguinte ao usar AWS Clean Rooms com tabelas Iceberg:

Tabelas Apache Iceberg para S3 — Apache Iceberg as tabelas devem ser definidas AWS Glue Data Catalog com base na implementação do catálogo de cola de código aberto.
Tabelas Apache Iceberg para Athena — Para obter mais informações, consulte -iceberg.html https://docs.aws.amazon.com/athena/ latest/ug/querying
Tabelas Apache Iceberg para Snowflake — Para obter mais informações, consulte guia do usuário/tables-iceberg https://docs.snowflake.com/en/
Formato de arquivo Parquet — AWS Clean Rooms só suporta tabelas Iceberg no formato de arquivo de dados Parquet.
Compressão GZIP e Snappy — AWS Clean Rooms suporta Parquet com GZIP e Snappy compressão.
Versões do Iceberg — AWS Clean Rooms suporta a execução de consultas nas tabelas Iceberg da versão 1 e da versão 2.
Partições — Você não precisa adicionar partições manualmente para o seu Apache Iceberg mesas em AWS Glue. AWS Clean Rooms detecta novas partições em Apache Iceberg tabelas automaticamente e nenhuma operação manual é necessária para atualizar partições na definição da tabela. As partições Iceberg aparecem como colunas regulares no esquema da tabela AWS Clean Rooms e não separadamente como uma chave de partição no esquema da tabela configurada.
Limitações
- Somente novas tabelas Iceberg
  
  Apache Iceberg tabelas convertidas de Apache Parquet tabelas não são suportadas.
- Consultas de viagem no tempo
  
  AWS Clean Rooms não suporta consultas de viagem no tempo com Apache Iceberg mesas.
- Mecanismo do Athena versão 2
  
  Iceberg tabelas criadas com a versão 2 do Athena Engine não são suportadas.
- Formatos de arquivo
  
  Avro e formatos de arquivo Optimized Row Columnar (ORC) não são suportados.
- Compactação
  
  Zstandard Compressão (Zstd) para Parquet não é suportado.

Tipos de dados suportados para tabelas Iceberg no Athena

AWS Clean Rooms pode consultar Iceberg tabelas que contêm os seguintes tipos de dados:

BOOLEAN
DATE
DECIMAL
DOUBLE
FLOAT
INT
LIST
LONG
MAP
STRING
STRUCT
TIMESTAMP WITHOUT TIME ZONE

Para obter mais informações sobre tipos de dados do Iceberg, consulte Esquemas para o Iceberg na documentação do Apache Iceberg.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Formatos de dados

Preparação de tabelas de dados