AWS Glue 콘솔 또는 를 사용하여 데이터 카탈로그에서 통계를 생성하기 위한 일정을 구성 AWS CLI 하거나 StartColumnStatisticsTaskRun 작업을 실행하려면 다음 단계를 따르세요.
열 통계 생성
-
에서 AWS Glue 콘솔에 로그인합니다https://console.aws.amazon.com/glue/
. -
데이터 카탈로그에서 테이블을 선택합니다.
-
목록에서 Iceberg 테이블을 선택합니다.
-
작업 메뉴에서 열 통계, 요청 시 생성을 선택합니다.
테이블 페이지 하단 섹션의 열 통계 탭에서 통계 생성 버튼을 선택해도 됩니다.
-
통계 생성 페이지에서 통계 생성 세부 정보를 입력합니다. 일정에 따른 열 통계 생성 섹션의 6~11단계에 따라 Iceberg 테이블에 대한 통계 생성 일정을 구성합니다.
의 지침에 따라 온디맨드 방식으로 열 통계를 생성하도록 선택할 수도 있습니다. 온디맨드 열 통계 생성
참고
샘플링 옵션은 Iceberg 테이블에 사용할 수 없습니다.
AWS Glue 는 Iceberg 테이블의 각 열에 대한 고유 값 수를 Amazon S3 위치에서 지정된 스냅샷 ID에 커밋된 새 Puffin 파일로 계산합니다.