Suporte à compressão de tabelas do Iceberg por formato de arquivo - Amazon Athena

Suporte à compressão de tabelas do Iceberg por formato de arquivo

O suporte à compressão do Apache Iceberg no Athena depende da versão do mecanismo.

Suporte à compressão do Iceberg na versão 3 do mecanismo do Athena

A tabela a seguir resume o suporte a formatos de compressão na versão 3 do mecanismo no Athena para formatos de arquivo de armazenamento no Apache Iceberg. “Sim” ou “Não” em uma célula se aplicam igualmente às operações de leitura e gravação, exceto quando indicado. Para as finalidades desta tabela, CREATE TABLE, CTAS e INSERT INTO serão consideradas operações de gravação. O formato de armazenamento padrão para o Iceberg no mecanismo do Athena versão 3 é Parquet. O formato de compactação padrão para o Iceberg no mecanismo do Athena versão 3 é ZSTD. Para obter mais informações sobre o uso de níveis de compressão ZSTD no Athena, consulte Usar níveis de compressão ZSTD no Athena.

Avro ORC Parquet (padrão)
BZIP2 Não Não Não
GZIP Sim Não Sim
LZ4 Não Sim Não
SNAPPY Sim Sim Sim
ZLIB Não Sim Não
ZSTD Sim Sim Sim (padrão)
NONE Sim (especificar None ou Deflate) Sim Sim (especificar None ou Uncompressed)

Suporte à compressão do Iceberg na versão 2 do mecanismo do Athena

A tabela a seguir resume o suporte a formatos de compressão na versão 2 do mecanismo do Athena para Apache Iceberg. “Sim” ou “Não” em uma célula se aplicam igualmente às operações de leitura e gravação, exceto quando indicado. Para as finalidades desta tabela, CREATE TABLE, CTAS e INSERT INTO serão consideradas operações de gravação. O formato de armazenamento padrão para o Iceberg no mecanismo do Athena versão 2 é Parquet. O formato de compactação padrão para o Iceberg no mecanismo do Athena versão 2 é GZIP.

Avro

(Sem suporte)

ORC

(Não suportado)

Parquet (padrão)
BZIP2 Não Não Não
GZIP Não Não Sim (padrão)
LZ4 Não Não Não
SNAPPY Não Não Sim
ZLIB Não Não Não
ZSTD Não Não Sim
NONE Não Não Sim