열 통계 보기 - AWS Glue

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

열 통계 보기

통계를 성공적으로 생성한 후 Data Catalog는 비용 기반 최적화 프로그램이 쿼리를 실행할 때 최적의 선택을 할 수 있도록 Amazon Athena과 Amazon Redshift에 이 정보를 저장합니다. 통계는 열의 유형에 따라 달라집니다.

AWS Management Console
테이블의 열 통계를 보는 방법
  • 열 통계 작업을 실행한 후 테이블 세부정보 페이지의 열 통계 탭에 테이블의 통계가 표시됩니다.

    스크린샷은 가장 최근 실행에서 생성된 열을 보여줍니다.

    다음과 같은 통계를 사용할 수 있습니다.

    • 열 이름: 통계 생성에 사용되는 열 이름

    • 최종 업데이트: 통계가 생성된 날짜 및 시각

    • 평균 길이: 열에 있는 값의 평균 길이

    • 고유 값: 열의 고유 값 총 수입니다. 상대 오차가 5% 인 열의 고유 값 수를 추정합니다.

    • 최대값: 열에서 최고 값입니다.

    • 최소값: 열에서 최저 값입니다.

    • 최대 길이: 열에서 최고 값의 길이입니다.

    • 열의 null 값의 수입니다.

    • 열의 true 값의 수입니다.

    • 열의 false 값의 수입니다.

    • numFiles: 테이블에 있는 총 파일 수. 이 값은 고급 속성 탭에 제공됩니다.

AWS CLI

다음 예제에서는 AWS CLI를 사용하여 열 통계를 검색하는 방법을 보여줍니다.

aws glue get-column-statistics-for-table \ --database-name <test_db> \ --table-name <test_tble> \ --column-names <col1>

또한 GetColumnStatisticsForTable API 작업을 사용하여 열 통계를 볼 수 있습니다.