OPS04-BP04 종속성 원격 측정 구현 - AWS Well-Architected Framework

OPS04-BP04 종속성 원격 측정 구현

종속성 원격 측정은 워크로드가 의존하는 외부 서비스 및 구성 요소의 상태와 성능을 모니터링하는 데 필수적입니다. DNS, 데이터베이스 또는 타사 API와 같은 종속성과 관련된 연결성, 시간 초과 및 기타 중요한 이벤트에 대한 귀중한 인사이트를 제공합니다. 이러한 종속성에 대한 지표, 로그 및 추적을 내보내도록 애플리케이션을 계측하면 워크로드에 영향을 미칠 수 있는 잠재적 병목 현상, 성능 문제 또는 장애를 더 명확하게 이해할 수 있습니다.

원하는 결과: 워크로드가 의존하는 종속성이 예상대로 수행되어 문제를 사전에 해결하고 최적의 워크로드 성능을 보장할 수 있습니다.

일반적인 안티 패턴:

  • 외부 종속성 간과: 내부 애플리케이션 지표에만 초점을 맞추고 외부 종속성과 관련된 지표는 무시합니다.

  • 사전 모니터링 부족: 종속성 상태 및 성능을 지속적으로 모니터링하는 대신 문제가 발생할 때까지 기다립니다.

  • 사일로화된 모니터링: 여러 개의 다른 모니터링 도구를 사용하여 종속성 상태에 대한 보기가 단편적이고 일관성이 없을 수 있습니다.

이 모범 사례 확립의 이점:

  • 워크로드 신뢰성 향상: 외부 종속성을 지속적으로 사용할 수 있고 최적의 성능을 발휘하도록 보장합니다.

  • 더 빠른 문제 탐지 및 해결: 종속성 관련 문제가 워크로드에 영향을 미치기 전에 사전에 식별하고 해결합니다.

  • 포괄적 관점: 워크로드 상태에 영향을 미치는 내부 및 외부 구성 요소를 모두 포괄적으로 파악합니다.

  • 워크로드 확장성 향상: 외부 종속 확장성의 한계와 성능 특성을 이해합니다.

이 모범 사례를 따르지 않을 경우 노출 위험도: 높음

구현 가이드

워크로드가 의존하는 서비스, 인프라 및 프로세스를 식별하는 것부터 시작하여 종속성 원격 측정을 구현하세요. 이러한 종속성이 예상대로 작동할 때 양호한 조건이 어떻게 보이는지 정량화한 다음 이를 측정하는 데 필요한 데이터를 결정하세요. 이 정보를 사용하여 운영 팀에 이러한 종속성 상태에 대한 인사이트를 제공하는 대시보드 및 알림을 만들 수 있습니다. AWS 도구를 사용하여 종속성이 필요한 만큼 제공할 수 없을 때 미치는 영향을 발견하고 정량화하세요. 전략을 지속적으로 재검토하여 우선 순위, 목표 및 얻은 인사이트의 변화를 고려하세요.

구현 단계

종속성 원격 측정을 효과적으로 구현하는 방법:

  1. 외부 종속성 파악: 이해관계자와 협업하여 워크로드가 의존하는 외부 종속성을 정확히 찾아냅니다. 외부 종속성에는 외부 데이터베이스, 타사 API, 다른 환경으로의 네트워크 연결 경로, DNS 서비스와 같은 서비스가 포함될 수 있습니다. 효과적인 종속성 원격 측정을 위한 첫 번째 단계는 이러한 종속성이 무엇인지 포괄적으로 이해하는 것입니다.

  2. 모니터링 전략 수립: 외부 종속성을 명확하게 파악한 후에는 그에 맞는 모니터링 전략을 세웁니다. 여기에는 각 종속성의 중요도, 예상되는 동작, 관련 서비스 수준에 관한 계약 또는 대상(SLA 또는 SLT)을 이해하는 것이 포함됩니다. 사전 알림을 설정하여 상태 변경 또는 성능 편차에 대한 알림을 받습니다.

  3. 네트워크 모니터링 사용: 전 세계 인터넷 및 네트워크 상태에 대한 포괄적인 인사이트를 제공하는 Internet MonitorNetwork Monitor를 사용합니다. 이러한 도구는 외부 종속성에 영향을 미치는 운영 중단, 장애 또는 성능 저하를 이해하고 이에 대응하는 데 도움이 됩니다.

  4. AWS Health Dashboard로 최신 정보 획득: AWS에 서비스에 영향을 줄 수 있는 이벤트가 발생할 경우 이를 알리고 수정 지침을 제공합니다.

    1. Amazon EventBridge 규칙을 사용하여 AWS Health 이벤트를 모니터링하거나 AWS Health API와 프로그래밍 방식으로 통합하여 AWS Health 이벤트를 수신할 때 작업을 자동화합니다. 이러한 작업은 계획된 모든 수명 주기 이벤트 메시지를 채팅 인터페이스로 보내는 것과 같은 일반적인 작업이거나 IT 서비스 관리 도구에서 워크플로를 시작하는 것과 같은 구체적인 작업일 수 있습니다.

    2. AWS Organizations를 사용하는 경우 전체 계정의 AWS Health 이벤트를 집계합니다.

  5. AWS X-Ray로 애플리케이션 계측: AWS X-Ray는 애플리케이션과 기본 종속성이 어떻게 수행되는지에 대한 인사이트를 제공합니다. 요청을 처음부터 끝까지 추적하여 애플리케이션이 의존하는 외부 서비스 또는 구성 요소의 병목 현상이나 장애를 식별할 수 있습니다.

  6. Amazon DevOps Guru 사용: 이 기계 학습 기반 서비스는 운영 문제를 식별하고, 중대한 문제가 발생할 수 있는 시기를 예측하고, 취해야 할 구체적인 조치를 제시합니다. 종속성에 대한 인사이트를 얻고 종속성에서 운영 문제가 발생하지 않도록 하는 데 매우 중요합니다.

  7. 주기적 모니터링: 외부 종속성과 관련된 지표 및 로그를 지속적으로 모니터링합니다. 예상치 못한 동작이나 성능 저하에 대한 알림을 설정합니다.

  8. 변경 후 검증: 외부 종속성이 업데이트되거나 변경될 때마다 성능을 검증하고 애플리케이션 요구 사항에 맞는지 확인합니다.

구현 계획의 작업 수준: 중간

리소스

관련 모범 사례:

관련 문서:

관련 동영상:

관련 예시: