부록 1 - MTTD 및 MTTR 중요 지표 - 가용성과 그 이상: 분산 시스템의 복원력에 대한 이해 및 개선 AWS

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

부록 1 - MTTD 및 MTTR 중요 지표

다음은 이벤트 발생 시 MTTD 및 MTTR을 줄이는 데 도움이 될 수 있는 계측 및 관찰성 표준화의 프레임워크입니다.

고객 경험 지표 이러한 지표는 서비스가 응답성이 뛰어나고 고객 요청을 처리할 수 있음을 반영합니다. 컨트롤 플레인 지연 시간을 예로 들 수 있습니다. 이러한 지표는 오류율, 가용성, 지연 시간, 볼륨 및 제한 속도를 측정합니다.

영향 평가 지표 이러한 지표는 이벤트 발생 시 영향의 범위에 대한 통찰력을 제공합니다. 데이터 영역 이벤트의 영향을 받은 고객 수 또는 비율을 예로 들 수 있습니다. 영향을 받는 항목의 수 또는 비율을 측정합니다.

운영 상태 지표 이러한 지표는 서비스가 대응력이 뛰어나고 고객 요청을 처리할 수 있지만 공통 인프라 하위 시스템 및 리소스에 초점을 맞추고 있음을 반영합니다. EC2 플릿의 CPU 사용률 비율을 예로 들 수 있습니다. 이러한 지표는 사용률, 용량, 처리량, 오류율, 가용성 및 지연 시간을 측정해야 합니다.