OPS04-BP05 분산 추적 구현 - 운영 우수성 원칙

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

OPS04-BP05 분산 추적 구현

분산 추적은 분산 시스템의 다양한 구성 요소를 통과하는 요청을 모니터링하고 시각화하는 방법을 제공합니다. 여러 소스에서 추적 데이터를 캡처하고 통합 보기에서 분석함으로써 팀은 요청의 흐름, 병목 현상, 최적화 작업이 집중되는 위치를 더 잘 이해할 수 있습니다.

원하는 성과: 분산 시스템을 통해 흐르는 요청을 전체적으로 파악하여 정확한 디버깅, 최적화된 성능 및 향상된 사용자 경험을 제공합니다.

일반적인 안티 패턴:

  • 일관되지 않은 계측: 분산 시스템의 일부 서비스가 추적을 위해 계측되지 않습니다.

  • 지연 시간 무시: 오류에만 초점을 맞추고 지연 시간이나 점진적인 성능 저하는 고려하지 않습니다.

이 모범 사례 확립의 이점:

  • 포괄적인 시스템 개요: 시작부터 종료까지 요청의 전체 경로를 시각화합니다.

  • 향상된 디버깅: 장애 또는 성능 문제가 발생한 위치를 신속하게 식별합니다.

  • 향상된 사용자 경험: 실제 사용자 데이터를 기반으로 모니터링 및 최적화하여 시스템이 실제 요구 사항을 충족하는지 확인합니다.

이 모범 사례가 확립되지 않을 경우 노출되는 위험 수준: 높음

구현 가이드

먼저 계측이 필요한 워크로드의 모든 요소를 식별합니다. 모든 구성 요소가 고려되면 AWS X-Ray 및 와 같은 도구를 활용하여 X-Ray 및 Amazon CloudWatch ServiceLens Map과 같은 도구를 사용하여 분석을 위한 추적 데이터를 OpenTelemetry 수집합니다. 개발자와의 정기 검토에 참여하고 Amazon DevOpsGuru, X-Ray Analytics 및 X-Ray Insights와 같은 도구를 사용하여 이러한 논의를 보완하여 더 심층적인 결과를 발견할 수 있습니다. 추적 데이터로부터 알림을 설정하여 워크로드 모니터링 계획에 정의된 대로 결과가 위험에 처했을 때 이를 알립니다.

구현 단계

분산 추적을 효과적으로 구현하는 방법:

  1. AWS X-Ray 채택: X-Ray를 애플리케이션에 통합하여 애플리케이션 동작에 대한 인사이트를 얻고 성능을 이해하며 병목 현상을 정확히 찾아내세요. 자동 추적 분석을 위해 X-Ray Insights를 활용하세요.

  2. 서비스 계측: AWS Lambda 함수에서 EC2 인스턴스 에 이르는 모든 서비스가 추적 데이터를 전송하는지 확인합니다. 계측하는 서비스가 많을수록 보기가 end-to-end 더 선명해집니다.

  3. CloudWatch 실제 사용자 모니터링합성 모니터링 통합: 실제 사용자 모니터링(RUM) 및 합성 모니터링을 X-Ray와 통합합니다. 이를 통해 실제 사용자 경험을 캡처하고 사용자 상호 작용을 시뮬레이션하여 잠재적 문제를 식별할 수 있습니다.

  4. CloudWatch 에이전트 사용 : 에이전트는 X-Ray 또는 에서 추적을 전송 OpenTelemetry하여 얻은 인사이트의 깊이를 높일 수 있습니다.

  5. Amazon DevOpsGuru : DevOpsGuru는 X-Ray CloudWatch, AWS Config및 의 데이터를 사용하여 실행 가능한 권장 사항을 AWS CloudTrail 제공합니다.

  6. 추적 분석: 추적 데이터를 정기적으로 검토하여 애플리케이션 성능에 영향을 줄 수 있는 패턴, 이상 또는 병목 현상을 식별합니다.

  7. 알림 설정: 비정상적인 패턴 또는 지연 시간에 CloudWatch 대해 에서 경보를 구성하여 사전 예방적 문제 해결을 허용합니다.

  8. 지속적인 개선: 모든 관련 데이터 포인트를 캡처하도록 서비스가 추가 또는 수정되면 추적 전략을 재검토합니다.

구현 계획의 작업 수준: 중간

리소스

관련 모범 사례:

관련 문서:

관련 비디오:

관련 예제: