PERF03-BP04 데이터 스토어에서 쿼리 성능을 개선하기 위한 전략 구현
데이터를 최적화하고 데이터 쿼리를 개선하는 전략을 구현하여 워크로드에 대한 확장성과 효율적인 성능을 향상할 수 있습니다.
일반적인 안티 패턴:
-
데이터 스토어에서는 데이터를 파티션하지 않습니다.
-
데이터 스토어에 하나의 파일 형식으로만 데이터를 저장합니다.
-
데이터 스토어에서 인덱스를 사용하지 않습니다.
이 모범 사례 확립의 이점: 데이터 및 쿼리 성능을 최적화하면 효율성이 향상되고 비용이 절감되며 사용자 경험이 향상됩니다.
이 모범 사례가 확립되지 않을 경우 노출되는 위험 수준: 보통
구현 가이드
데이터 최적화 및 쿼리 튜닝은 전체 클라우드 워크로드의 성능과 응답성에 영향을 미치기 때문에 데이터 스토어의 성능 효율성에 있어 매우 중요한 측면입니다. 쿼리가 최적화되지 않으면 리소스 사용량과 병목 현상이 증가하여 데이터 스토어의 전반적인 효율성이 저하될 수 있습니다.
데이터 최적화는 효율적인 데이터 스토리지와 액세스를 위한 여러 기술을 포함합니다. 또한 데이터 저장소의 쿼리 성능을 개선하는 데도 도움이 됩니다. 주요 전략에는 데이터 파티셔닝, 데이터 압축, 데이터 비정규화가 포함되며, 이는 스토리지와 액세스 모두에 대해 데이터를 최적화하는 데 도움이 됩니다.
구현 단계
-
데이터 스토어에서 수행되는 중요한 데이터 쿼리를 이해하고 분석합니다.
-
데이터 스토어에서 느린 쿼리를 식별하고 쿼리 계획을 사용하여 현재 상태를 파악합니다.
-
쿼리 성능을 개선하기 위한 전략을 구현합니다. 몇 가지 주요 전략은 다음과 같습니다.
-
보존 기간이 단축된 컬럼 파일 형식 (예: Parquet 또는 ORC)
-
데이터 스토어의 데이터를 압축하여 스토리지 공간 및 I/O 작업을 축소
-
데이터를 더 작은 부분으로 분할하고 데이터 스캔 시간을 줄이기 위한 데이터 파티셔닝.
-
쿼리의 공통 열에 대한 데이터 인덱싱.
-
쿼리에 적합한 조인 작업을 선택 두 테이블을 조인하는 경우 조인 왼쪽에 큰 테이블을 지정하고 조인 오른쪽에 작은 테이블을 지정합니다.
-
지연 시간을 개선하고 데이터베이스 I/O 작업 횟수를 줄이기 위한 분산 캐싱 솔루션.
-
통계 실행과 같은 정기적인 유지 관리
-
-
비운영 환경에서의 실험 및 테스트 전략
리소스
관련 문서:
관련 동영상:
관련 예시: