에서 Apache Iceberg 테이블 사용 AWS Clean Rooms - AWS Clean Rooms

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

에서 Apache Iceberg 테이블 사용 AWS Clean Rooms

Apache Iceberg데이터 레이크용 오픈 소스 테이블 형식입니다. AWS Clean Rooms Apache Iceberg메타데이터에 저장된 통계를 사용하여 쿼리 계획을 최적화하고 클린룸 쿼리 처리 중에 파일 스캔을 줄일 수 있습니다. 자세한 내용은 Apache Iceberg를 참조하세요.

Iceberg AWS Clean Rooms 테이블과 함께 사용할 때는 다음 사항을 고려하십시오.

  • AWS Glue Data Catalog 유일한 테이블 — Apache Iceberg 테이블은 오픈 소스 글루 카탈로그 구현을 AWS Glue Data Catalog 기반으로 정의되어야 합니다.

  • 파켓 파일 형식 - Parquet 데이터 파일 형식의 Iceberg AWS Clean Rooms 테이블만 지원합니다.

  • GZIP 및 빠른 압축 — GZIP 및 압축을 통한 AWS Clean Rooms 파켓을 지원합니다. Snappy

  • Iceberg 버전 — 버전 1 및 버전 2 Iceberg 테이블에 대한 쿼리 실행을 AWS Clean Rooms 지원합니다.

  • 파티션 — Apache Iceberg 테이블에 파티션을 수동으로 추가할 필요가 없습니다. AWS Glue AWS Clean Rooms 테이블에서 새 파티션을 자동으로 검색하므로 Apache Iceberg 테이블 정의에서 파티션을 업데이트하는 데 수동 작업이 필요하지 않습니다. Iceberg 파티션은 구성된 AWS Clean Rooms 테이블 스키마에서 파티션 키로 별도로 표시되지 않고 테이블 스키마에서 일반 열로 나타납니다.

  • 제한 사항

    • 새 아이스버그 테이블에만 해당

      Apache Parquet 테이블에서 변환된 Apache Iceberg 테이블은 지원되지 않습니다.

    • 시간 이동 쿼리

      AWS Clean Rooms Apache Iceberg테이블을 사용한 시간 여행 쿼리는 지원하지 않습니다.

    • Athena 엔진 버전 2

      Athena 엔진 버전 2로 생성된 Iceberg 테이블은 지원되지 않습니다.

    • 파일 형식

      Avro 및 Optimized Row Columnar(ORC) 파일 형식은 지원되지 않습니다.

    • 압축

      Parquet에 대한 Zstandard(Zstd) 압축은 지원되지 않습니다.

Iceberg 테이블에 대해 지원되는 데이터 형식

AWS Clean Rooms 다음 데이터 유형이 포함된 Iceberg 테이블을 쿼리할 수 있습니다.

  • boolean

  • date

  • decimal

  • double

  • float

  • int

  • list

  • long

  • map

  • string

  • struct

  • timestamp without time zone

Iceberg 데이터 형식에 대한 자세한 내용은 Apache Iceberg 설명서에서 Iceberg용 스키마를 참조하세요.