PERF02-BP03 컴퓨팅 관련 지표 수집 - AWS Well-Architected Framework

PERF02-BP03 컴퓨팅 관련 지표 수집

컴퓨팅 관련 지표를 기록하고 추적하여 컴퓨팅 리소스의 성능을 더 잘 파악하고 성능과 사용률을 높입니다.

일반적인 안티 패턴:

  • 지표에 대해 수동 로그 파일 검색만 사용합니다. 

  • 해당 모니터링 소프트웨어에서 기록한 기본 지표만 사용합니다.

  • 문제가 발생한 경우에만 지표를 검토합니다.

이 모범 사례 확립의 이점: 성능 관련 지표를 수집하면 애플리케이션 성능을 비즈니스 요구 사항에 맞게 조정하여 워크로드 필요 사항을 충족하는 데 도움이 됩니다. 또한 워크로드의 리소스 성능과 사용률을 지속적으로 개선하는 데 도움이 될 수 있습니다.

이 모범 사례가 확립되지 않을 경우 노출되는 위험 수준: 높음

구현 가이드

클라우드 워크로드를 통해 지표, 로그 및 이벤트와 같은 대량의 데이터가 생성될 수 있습니다. AWS 클라우드에서 지표 수집은 보안, 비용 효율성, 성능 및 지속 가능성을 개선하기 위한 중요한 단계입니다. AWS는 Amazon CloudWatch 같은 모니터링 서비스를 통해 다양한 성능 관련 지표를 제공하여 중요한 인사이트를 제공합니다. CPU 사용률, 메모리 사용률, 디스크 I/O, 네트워크 인바운드 및 아웃바운드와 같은 지표는 사용률 수준 또는 성능 병목 현상에 대한 인사이트를 제공할 수 있습니다. 데이터 기반 접근 방식의 일환으로 이 지표를 사용하면 워크로드 리소스를 능동적으로 튜닝하고 최적화할 수 있습니다.  비용 및 운영 목표를 지원하기 위해 보존 정책이 구현된 단일 플랫폼에서 컴퓨팅 리소스와 관련된 모든 지표를 수집하는 것이 이상적입니다.

구현 단계

  1. 워크로드와 관련된 성능 관련 지표를 파악합니다. 리소스 사용률과 클라우드 워크로드의 운영 방식(응답 시간 및 처리량 등)에 대한 지표를 수집해야 합니다.

  2. 워크로드에 적합한 로깅 및 모니터링 솔루션을 선택하고 설정합니다.

  3. 워크로드 요구 사항에 따라 지표에 필요한 필터 및 집계를 정의합니다.

  4. 보안 및 운영 목표에 맞게 지표에 대한 데이터 보존 정책을 구성합니다.

  5. 필요한 경우 지표에 대한 경보 및 알림을 생성하여 성능 관련 문제에 미리 대응할 수 있습니다.

  6. 자동화를 사용하여 지표 및 로그 집계 에이전트를 배포합니다.

리소스

관련 문서:

관련 동영상:

관련 예시: