일반 모범 사례 - AWS 규범적 지침

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

일반 모범 사례

다음 모범 사례는 Amazon RDS 워크로드의 상태를 충분히 파악하고 운영 이벤트 및 모니터링 데이터에 대응하여 적절한 조치를 취하는 데 도움이 됩니다.

  • KPI를 확인하십시오.원하는 비즈니스 성과를 기반으로 핵심 성과 지표 (KPI) 를 식별합니다. KPI를 평가하여 워크로드 성공 여부를 확인하십시오. 예를 들어, 핵심 비즈니스가 전자 상거래인 경우 원하는 비즈니스 성과 중 하나는 고객이 연중 무휴로 전자 상점을 통해 쇼핑을 할 수 있다는 것입니다. 이러한 비즈니스 성과를 달성하려면 e-shop 애플리케이션에서 사용하는 백엔드 Amazon RDS 데이터베이스의 가용성 KPI를 정의하고 기준 KPI를 매주 99.99% 로 설정해야 합니다. 기준 값과 비교하여 실제 가용성 KPI를 평가하면 99.99% 의 원하는 데이터베이스 가용성을 충족하여 연중무휴 서비스를 통해 비즈니스 성과를 달성하고 있는지 확인할 수 있습니다.

  • 워크로드 지표를 정의합니다.Amazon RDS 워크로드의 양과 품질을 측정하기 위한 워크로드 지표를 정의하십시오. 지표를 평가하여 워크로드가 원하는 결과를 달성하고 있는지 확인하고 워크로드의 상태를 이해하십시오. 예를 들어 Amazon RDS DB 인스턴스의 가용성 KPI를 평가하려면 DB 인스턴스의 업타임 및 다운타임과 같은 지표를 측정해야 합니다. 그런 다음 이러한 지표를 사용하여 다음과 같이 가용성 KPI를 계산할 수 있습니다.

    availability = uptime / (uptime + downtime)

    지표는 시간순으로 정렬된 데이터 요소 집합을 나타냅니다. 측정항목에는 분류 및 분석에 유용한 측정기준도 포함될 수 있습니다.

  • 워크로드 메트릭을 수집 및 분석합니다.Amazon RDS는 구성에 따라 다양한 지표와 로그를 생성합니다. 이들 중 일부는 다음과 같은 DB 인스턴스 이벤트, 카운터 또는 통계를 나타냅니다.db.Cache.innoDB_buffer_pool_hits. 다음과 같은 기타 지표는 운영 체제에서 제공됩니다.memory.Total호스트 Amazon Elastic Compute Cloud (Amazon EC2) 인스턴스의 총 메모리 양을 측정합니다. 모니터링 도구는 수집된 지표를 정기적으로 사전 예방적으로 분석하여 추세를 파악하고 적절한 대응이 필요한지 판단해야 합니다.

  • 워크로드 지표 기준을 설정합니다.기대 값을 정의하고 양호 또는 불량 임계값을 식별하기 위한 메트릭의 기준을 설정합니다. 예를 들어, 에 대한 기준을 정의할 수 있습니다.ReadIOPS일반 데이터베이스 작업에서는 최대 1,000개까지 가능합니다. 그런 다음 이 기준을 사용하여 비교하고 초과 사용률을 식별할 수 있습니다. 새로운 지표에서 읽기 IOPS가 2,0003,000 범위인 것으로 일관되게 나타난다면 조사, 개입 및 개선을 위한 대응을 촉발할 수 있는 편차를 식별한 것입니다.

  • 워크로드 결과가 위험에 처했을 때 경보를 발령합니다.비즈니스 성과가 위험하다고 판단되면 경고를 보내십시오. 그런 다음 문제가 고객에게 영향을 미치기 전에 사전에 문제를 해결하거나 인시던트의 영향을 적시에 완화할 수 있습니다.

  • 워크로드의 예상 활동 패턴을 파악하세요.지표 기준을 기반으로 워크로드 활동 패턴을 설정하여 예상치 못한 동작을 식별하고 필요한 경우 적절한 조치로 대응하십시오.AWS에서 제공합니다모니터링 도구통계 및 기계 학습 알고리즘을 적용하여 메트릭을 분석하고 이상을 감지합니다.

  • 워크로드 이상이 감지되면 경고합니다.Amazon RDS 워크로드 운영에서 이상이 감지되면 알림을 생성하여 필요한 경우 적절한 조치를 취할 수 있도록 하십시오.

  • KPI 및 지표를 검토 및 수정합니다. Amazon RDS 데이터베이스가 정의된 요구 사항을 충족하는지 확인하고 비즈니스 목표를 달성하기 위한 잠재적 개선 영역을 식별하십시오. 측정된 지표와 평가된 KPI의 효과를 검증하고 필요한 경우 수정하십시오. 예를 들어 최적의 동시 데이터베이스 연결 수에 대한 KPI를 설정하고 시도된 연결 및 실패한 연결과 생성되어 실행 중인 사용자 스레드에 대한 메트릭을 모니터링한다고 가정해 보겠습니다. KPI 기준에 정의된 것보다 더 많은 데이터베이스 연결이 있을 수 있습니다. 현재 지표를 분석하면 결과를 감지할 수 있지만 근본 원인을 파악하지 못할 수도 있습니다. 그렇다면 측정치를 수정하고 테이블 잠금 카운터와 같은 추가 모니터링 조치를 포함해야 합니다. 새 지표는 데이터베이스 연결 수 증가가 예상치 못한 테이블 잠금으로 인한 것인지 판단하는 데 도움이 됩니다.