OPS08-BP05 대시보드 만들기 - 운영 우수성 원칙

OPS08-BP05 대시보드 만들기

대시보드는 워크로드의 원격 측정 데이터를 사람 중심으로 볼 수 있는 뷰입니다. 중요한 시각적 인터페이스를 제공하지만 경고 메커니즘을 대체하는 것이 아니라 보완해야 합니다. 주의를 기울여 제작하면 시스템 상태 및 성능에 대한 빠른 인사이트를 제공할 뿐만 아니라 이해 관계자에게 비즈니스 성과 및 문제의 영향에 대한 실시간 정보를 제공할 수 있습니다.

원하는 결과:

시각적 표현을 사용하여 시스템 및 비즈니스 상태에 대한 명확하고 실행 가능한 인사이트를 제공합니다.

일반적인 안티 패턴:

  • 너무 많은 지표로 인해 대시보드가 지나치게 복잡해집니다.

  • 이상 항목 탐지에 대한 경고 없이 대시보드를 사용합니다.

  • 워크로드가 진화해도 대시보드를 업데이트하지 않습니다.

이 모범 사례 확립의 이점:

  • 중요한 시스템 지표와 KPI에 대한 가시성을 즉각적으로 확보합니다.

  • 이해관계자 커뮤니케이션 및 이해를 강화합니다.

  • 운영 문제의 영향에 대해 신속한 인사이트를 얻습니다.

이 모범 사례를 따르지 않을 경우 노출 위험도: 중간

구현 가이드

비즈니스 중심 대시보드

비즈니스 KPI에 맞게 조정된 대시보드는 다양한 이해관계자를 참여시킵니다. 이러한 개인은 시스템 지표에 관심이 없을 수도 있지만 이러한 수치가 비즈니스에 미치는 영향을 이해하는 데 관심이 있습니다. 비즈니스 중심 대시보드를 사용하면 모니터링 및 분석되는 모든 기술 및 운영 지표가 중요한 비즈니스 목표와 동기화됩니다. 이러한 정렬은 모든 사람이 무엇이 필수적이고 무엇이 아닌지에 대해 동일한 이해를 가질 수 있도록 명확성을 제공합니다. 또한 비즈니스 KPI를 강조하는 대시보드는 실행 가능성이 더 높은 경향이 있습니다. 이해 관계자는 운영 상태, 주의가 필요한 영역, 비즈니스 성과에 미치는 잠재적 영향을 빠르게 이해할 수 있습니다.

이를 염두에 두고 대시보드를 만들 때는 기술 지표와 비즈니스 KPI 간에 균형을 유지해야 합니다. 둘 다 중요하지만 다양한 청중을 수용하도록 해야 합니다. 시스템의 상태와 성능을 전체적으로 볼 수 있는 동시에 주요 비즈니스 성과와 그 영향을 강조하는 대시보드를 사용하는 것이 가장 좋습니다.

Amazon CloudWatch 대시보드는 CloudWatch 콘솔의 맞춤형 홈페이지로, 다른 AWS 리전과 계정에 분산되어 있는 리소스까지 포함하여 모든 리소스를 단일 보기에서 모니터링하는 데 이용할 수 있습니다.

구현 단계

  1. 기본 대시보드 생성: CloudWatch에서 새 대시보드를 만들고 이 대시보드를 설명하는 이름을 지정합니다.

  2. Markdown 위젯 사용: 지표를 자세히 살펴보기 전에 Markdown 위젯을 사용하여 대시보드 상단에 텍스트로 컨텍스트를 추가합니다. 여기에는 대시보드에서 다루는 내용, 표시된 지표의 중요성이 설명되어야 하며 다른 대시보드 및 문제 해결 도구에 대한 링크도 포함될 수 있습니다.

  3. 대시보드 변수 생성: 동적이고 유연한 대시보드 보기를 위해 적절한 곳에 대시보드 변수를 추가합니다.

  4. 지표 위젯 생성: 애플리케이션이 내보내는 다양한 지표를 시각화하도록 지표 위젯을 추가하고 시스템 상태 및 비즈니스 결과가 효과적으로 표시되도록 위젯을 조정합니다.

  5. Log Insights 쿼리: CloudWatch Log Insights를 활용하여 로그에서 실행 가능한 지표를 도출하고 대시보드에 이러한 인사이트를 표시합니다.

  6. 경보 설정: CloudWatch 경보를 대시보드에 통합하여 임계값을 위반하는 모든 지표를 빠르게 확인합니다.

  7. Contributor Insights 사용: CloudWatch Contributor Insights를 통합하여 카디널리티가 높은 필드를 분석하고 리소스를 가장 많이 사용하는 항목을 더 명확하게 파악할 수 있습니다.

  8. 사용자 지정 위젯 설계: 표준 위젯으로는 충족되지 않는 특정 요구 사항에 대해서는 사용자 지정 위젯을 만드는 것이 좋습니다. 사용자 지정 위젯은 다양한 데이터 소스에서 데이터를 가져오거나 고유한 방식으로 데이터를 표현할 수 있습니다.

  9. AWS Health Dashboard 사용: AWS Health Dashboard를 사용하여 계정 상태, 이벤트, 서비스 및 리소스에 영향을 미칠 수 있는 향후 변경 사항에 대한 심층적인 인사이트를 얻습니다. 또한 AWS Organizations 내의 상태 이벤트를 한 곳에서 확인하거나 사용자 지정 대시보드를 만들 수 있습니다(자세한 내용은 관련 예시 참조).

  10. 반복 및 개선: 애플리케이션이 발전함에 따라 정기적으로 대시보드를 다시 방문하여 관련성을 확인합니다.

리소스

관련 모범 사례:

관련 문서:

관련 동영상:

관련 예시: