PERF05-BP02 모니터링 솔루션을 사용하여 성능이 가장 중요한 영역 파악 - AWS Well-Architected Framework

PERF05-BP02 모니터링 솔루션을 사용하여 성능이 가장 중요한 영역 파악

워크로드 성능을 개선하여 효율성을 높이고 고객 환경을 개선할 수 있는 영역을 파악합니다. 예를 들어, 많은 양의 고객 상호 작용이 수행되는 웹 사이트에서는 엣지 서비스를 사용하여 콘텐츠 전송 위치를 고객과 더 가까운 곳으로 이동하는 방법으로 성능을 개선할 수 있습니다.

일반적인 안티 패턴:

  • CPU 사용률 또는 메모리 압력과 같은 표준 컴퓨팅 지표로 성능 문제를 파악하기에 충분하다고 가정합니다.

  • 선택한 모니터링 소프트웨어에서 기록한 기본 지표만 사용합니다.

  • 문제가 발생한 경우에만 지표를 검토합니다.

이 모범 사례 확립의 이점: 성능의 중요 영역을 이해함으로써 워크로드 소유자가 KPI를 모니터링하고 큰 영향을 미치는 개선에 우선순위를 지정할 수 있습니다.

이 모범 사례가 확립되지 않을 경우 노출되는 위험의 수준: 높음

구현 가이드

트래픽 패턴, 지연 시간 및 중요한 성능 영역을 파악할 수 있는 엔드 투 엔드 추적을 설정합니다. 데이터 액세스 패턴을 모니터링하여 쿼리 속도가 느리거나 데이터 조각이 잘못되거나 잘못 분할된 데이터를 찾습니다. 로드 테스트 또는 모니터링을 사용하여 워크로드의 제한된 영역을 파악합니다.

아키텍처, 트래픽 패턴 및 데이터 액세스 패턴을 이해하여 성능 효율성이 향상되고 지연 시간 및 처리 시간을 파악합니다. 워크로드가 증가하면서 고객 환경에 영향을 미칠 수 있는 잠재적 병목 현상을 파악합니다. 이러한 영역을 조사한 후에는 이러한 성능 문제를 해결하기 위해 어떤 솔루션을 배포할 수 있는지 살펴보세요.

구현 단계

  1. 엔드 투 엔드 모니터링을 설정하여 모든 워크로드 구성 요소 및 지표를 캡처합니다. 다음은 AWS에 대한 모니터링 솔루션의 예입니다.

    서비스 사용 장소
    Amazon CloudWatch RUM(실제 사용자 모니터링) 실제 사용자 클라이언트측 및 프런트엔드 세션에서 애플리케이션 성능 지표를 포착합니다.
    AWS X-Ray  애플리케이션 계층을 통해 트래픽을 추적하고 구성 요소와 종속성 간의 지연 시간을 식별합니다. X-Ray 서비스 맵을 사용하여 워크로드 구성 요소 간 관계 및 지연 시간을 확인합니다.
    Amazon Relational Database Service 성능 개선 도우미  데이터베이스 성능 지표를 보고 성능 향상을 식별합니다.
    Amazon RDS 향상된 모니터링  데이터베이스 OS 성능 지표를 확인합니다.
    Amazon DevOps Guru 비정상적인 운영 패턴을 감지하여 고객에게 영향을 미치기 전에 운영 문제를 식별할 수 있습니다.
  2. 지표를 생성하고 트래픽 패턴, 병목 현상 및 중요한 성능 영역을 파악하기 위한 테스트를 수행합니다. 다음은 테스트를 수행하는 방법에 대한 몇 가지 예입니다.

    • 시간이 지남에 따라 일관된 지표를 생성하기 위해 Linux 크론 작업 또는 비율 표현식을 사용하여 프로그래밍 방식으로 브라우저 기반 사용자 활동을 모방하도록 CloudWatch Synthetic Canaries 를 설정합니다.

    • 최대 트래픽을 생성하거나 예상 증가율로 워크로드를 테스트할 수 있도록 AWS 분산 로드 테스트 솔루션을 사용합니다.

  3. 지표 및 텔레메트리를 평가하여 중요한 성능 영역을 파악합니다. 팀과 함께 이러한 영역을 검토하여 병목 현상을 방지할 수 있는 모니터링 및 솔루션을 논의합니다.

  4. 성능 개선을 실험하고 데이터로 이러한 변경 사항을 측정합니다. 예를 들어 CloudWatch Evidently 를 사용하여 워크로드에 대한 새로운 개선 사항 및 성능 영향을 테스트합니다.

리소스

관련 문서:

관련 동영상:

관련 예시: