쿼리 패턴 평가 - Amazon Redshift

쿼리 패턴 평가

분산 스타일 선택은 데이터베이스 설계의 한 측면에 불과합니다. 분산 스타일은 전체 시스템의 맥락에서 클러스터 크기, 압축 인코딩 방법, 정렬 키, 테이블 제약 조건 등 다른 중요한 요인과 분산의 밸런스를 유지하면서 고려해야 합니다.

최대한 실제 데이터에 가까운 데이터를 이용하여 시스템을 테스트하십시오.

배포 스타일을 효과적으로 선택하기 위해서는 Amazon Redshift 애플리케이션의 쿼리 패턴을 알고 있어야 합니다. 시스템에서 가장 비용이 높은 쿼리를 식별한 후 이러한 쿼리들의 수요를 기초로 초기 데이터베이스를 설계해야 합니다. 쿼리의 총 비용을 결정하는 요소에는 쿼리를 실행하는 데 걸리는 시간과 쿼리가 소비하는 컴퓨팅 리소스가 포함됩니다. 쿼리 비용을 결정하는 다른 요소는 실행 빈도와 다른 쿼리 및 데이터베이스 작업에 미치는 부정적 영향입니다.

가장 비용이 높은 쿼리에서 사용되는 테이블을 식별한 후 쿼리 런타임 시 이러한 테이블이 어떠한 역할을 하는지 평가합니다. 그리고, 테이블의 조인 및 집계 방식을 고려합니다.

각 테이블의 분산 스타일을 선택할 때는 이번 단원의 지침을 따르십시오. 이미 그렇게 배포 스타일을 선택했다면 테이블을 생성한 후 실제 데이터에 최대한 가까운 데이터를 테이블에 로드합니다. 그런 다음 사용할 것으로 예상되는 쿼리 유형에 대해 테이블을 테스트합니다. 쿼리 실행 계획을 평가하여 조정 필요성을 판단할 수 있습니다. 로드 시간, 스토리지 공간 및 쿼리 런타임을 서로 비교하면서 시스템의 전체 요구 사항 간의 밸런스를 유지합니다.