Hive 테이블 압축 사용 - Amazon Athena

Hive 테이블 압축 사용

Athena의 Hive 테이블 압축 옵션은 엔진 버전과 파일 형식에 따라 다릅니다.

Athena 엔진 버전 3의 Hive 압축 지원

다음 표에는 Apache Hive의 스토리지 파일 형식에 대한 Athena 엔진 버전 3의 압축 형식 지원이 요약되어 있습니다. 텍스트 파일 형식에는 TSV, CSV, JSON 및 텍스트용 사용자 정의 SerDes가 포함됩니다. 셀의 “예” 또는 “아니요”는 별도로 명시된 경우를 제외하고 읽기 작업과 쓰기 작업에 동일하게 적용됩니다. 이 테이블에서는 CREATE TABLE, CTAS 및 INSERT INTO를 쓰기 작업으로 간주합니다. Athena의 ZSTD 압축 수준 사용에 대한 자세한 내용은 ZSTD 압축 수준 사용 섹션을 참조하세요.

Avro Ion ORC PARQUET 텍스트 파일
bzip2 아니요 아니요
DEFLATE 아니요 아니요 아니요 아니요
GZIP 아니요 아니요
LZ4 아니요

쓰기 - 아니요

읽기 - 예

LZO 아니요

쓰기 - 아니요

읽기 - 예

아니요

쓰기 - 아니요

읽기 - 예

쓰기 - 아니요

읽기 - 예

Snappy
ZLIB 아니요 아니요 아니요 아니요
ZSTD
NONE

Athena 엔진 버전 2의 Hive 압축 지원

다음 표에는 Apache Hive용 Athena 엔진 버전 2의 압축 형식 지원이 요약되어 있습니다. 텍스트 파일 형식에는 TSV, CSV, JSON 및 텍스트용 사용자 정의 SerDes가 포함됩니다. 셀의 “예” 또는 “아니요”는 별도로 명시된 경우를 제외하고 읽기 작업과 쓰기 작업에 동일하게 적용됩니다. 이 테이블에서는 CREATE TABLE, CTAS 및 INSERT INTO를 쓰기 작업으로 간주합니다.

Avro Ion ORC PARQUET 텍스트 파일
bzip2 아니요 아니요
DEFLATE 아니요 아니요 아니요 아니요
GZIP 아니요 아니요
LZ4 아니요 아니요

쓰기 - 예

읽기 - 아니요

쓰기 - 아니요

읽기 - 예

LZO 아니요

쓰기 - 아니요

읽기 - 예

아니요

쓰기 - 아니요

읽기 - 예

Snappy
ZLIB 아니요 아니요 아니요 아니요
ZSTD 아니요
NONE