Grafana 관리형 알림 규칙 생성 - Amazon Managed Grafana

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Grafana 관리형 알림 규칙 생성

이 설명서 항목은 Grafana 버전 9.x를 지원하는 Grafana 작업 영역을 위해 설계되었습니다.

Grafana 버전 8.x를 지원하는 Grafana 작업 영역에 대한 내용은 을 참조하십시오. Grafana 버전 8에서 작업하기

Grafana를 사용하면 하나 이상의 데이터 소스를 쿼리하고, 결과를 줄이거나 변환하고, 서로 비교하거나 고정된 임계값과 비교하는 경고 규칙을 만들 수 있습니다. 이러한 작업이 실행되면 Grafana는 연락처에 알림을 보냅니다.

Grafana 관리형 규칙을 추가하려면
  1. Grafana 콘솔의 Grafana 메뉴에서 알림 (벨) 아이콘을 선택하여 기존 알림을 나열하는 알림 페이지를 엽니다.

  2. 새 알림 규칙을 선택합니다.

  3. 1단계에서 다음과 같이 규칙 이름, 유형 및 저장 위치를 추가합니다.

    • 규칙 이름에 설명이 포함된 이름을 추가합니다. 이 이름은 경고 규칙 목록에 표시됩니다. 또한 이 규칙에서 생성되는 모든 경고 인스턴스의 alertname 레이블이기도 합니다.

    • 규칙 유형 드롭다운에서 Grafana 관리형 알림을 선택합니다.

    • 폴더 드롭다운에서 규칙을 저장할 폴더를 선택합니다. 폴더를 선택하지 않으면 규칙이 General 폴더에 저장됩니다. 폴더를 만들려면 드롭다운을 선택하고 새 폴더 이름을 입력합니다.

  4. 2단계에서 평가할 쿼리와 식을 추가합니다.

    • 기본 이름을 그대로 사용하거나 커서로 가리킨 다음 편집 아이콘을 선택하여 이름을 변경합니다.

    • 쿼리의 경우 드롭다운에서 데이터 소스를 선택합니다.

    • 하나 이상의 쿼리 또는 식을 추가합니다.

    • 각 표현식에 대해 클래식 조건을 선택하여 단일 경고 규칙을 생성하거나 수학, 축소, 리샘플링 옵션 중에서 선택하여 시리즈별로 별도의 알림을 생성합니다. 이러한 옵션에 대한 자세한 내용은 을 참조하십시오단일 및 다차원 규칙.

    • 쿼리 실행을 선택하여 쿼리가 성공했는지 확인합니다.

  5. 3단계에서 조건을 추가합니다.

    • 조건 드롭다운에서 알림 규칙을 시작할 쿼리 또는 표현식을 선택합니다.

    • 평가 개수에 대해 평가 빈도를 지정합니다. 10초의 배수여야 합니다. 예, 1m, 30s.

    • 평가 기간에는 경고가 시작되기 전에 조건이 충족되어야 하는 기간을 지정합니다.

      참고

      조건이 위반된 후 경고는 상태가 됩니다. Pending 지정된 기간 동안 조건 위반이 계속되면 경고는 해당 상태로 전환됩니다. Firing 더 이상 충족되지 않으면 상태로 되돌아갑니다. Normal

    • 데이터 없음 및 오류 처리 구성에서 데이터가 없을 때의 알림 동작을 구성합니다. 에서 지침을 사용하십시오. 데이터 없음 또는 오류 사례 처리

    • 지금 쿼리 실행 결과를 확인하려면 알림 미리 보기를 선택합니다. 미리보기는 데이터 없음 및 오류 처리 조건을 제외합니다.

  6. 4단계에서 규칙과 관련된 메타데이터를 추가합니다.

    • 설명과 요약을 추가하여 경고 메시지를 사용자 지정합니다. 에서 지침을 사용하십시오라벨 및 주석.

    • 런북 URL, 패널, 대시보드, 알림 ID를 추가합니다.

    • 사용자 지정 레이블을 추가합니다.

  7. 저장을 선택하여 규칙을 저장하거나 저장 후 종료를 선택하여 규칙을 저장하고 알림 페이지로 돌아가십시오.

규칙을 만든 후 규칙에 대한 알림을 만들 수 있습니다. 알림에 대한 자세한 내용은 알림 알림 관리 섹션을 참조하세요.

단일 및 다차원 규칙

Grafana 관리형 알림 규칙의 경우 클래식 조건으로 규칙을 생성하거나 다차원 규칙을 생성할 수 있습니다.

1차원 규칙 (클래식 조건)

클래식 조건 표현식을 사용하여 조건이 충족될 때 단일 경고를 시작하는 규칙을 만들 수 있습니다. 여러 시리즈를 반환하는 쿼리의 경우 Grafana는 각 시리즈의 알림 상태를 추적하지 않습니다. 따라서 Grafana는 여러 시리즈의 알림 조건이 충족되는 경우에도 단일 알림만 전송합니다.

표현식의 형식을 지정하는 방법에 대한 자세한 내용은 Grafana 설명서의 표현식을 참조하십시오.

다차원 규칙

쿼리에서 반환된 각 시리즈에 대해 별도의 경고 인스턴스를 생성하려면 다차원 규칙을 생성하십시오.

참고

다차원 규칙으로 생성된 각 경고 인스턴스는 총 경고 할당량에 포함됩니다. 알림 할당량에 도달하면 규칙이 평가되지 않습니다. 다차원 규칙의 할당량에 대한 자세한 내용은 을 참조하십시오. 할당량 도달 오류

단일 규칙에서 여러 인스턴스를 만들려면 MathReduce, 또는 Resample 식을 사용하여 다차원 규칙을 만드십시오. 예를 들어, 다음을 수행할 수 있습니다.

  • 각 쿼리에 Reduce 식을 추가하여 선택한 시간 범위의 값을 단일 값으로 집계합니다. (숫자 데이터를 사용하는 규칙에는 필요하지 않음).

  • 규칙 조건이 포함된 Math 표현식을 추가합니다. 쿼리 또는 reduce 표현식이 이미 0을 반환하고 규칙이 경고를 시작하지 않아야 하는 경우 양수를 반환하는 경우에는 이 방법이 필요하지 않습니다.

    다음은 일부 예입니다.

    • $B > 70B 쿼리/표현식의 값이 70을 초과하는 경우 알림을 시작해야 하는지 여부.

    • $B < $C * 100B 값이 C 값에 100을 곱한 값보다 작으면 알림을 시작해야 하는 경우 비교 대상 쿼리 결과에 여러 시리즈가 있는 경우 레이블이 같거나 한 쿼리가 다른 쿼리의 하위 집합이면 서로 다른 쿼리의 시리즈가 일치됩니다.

참고

Grafana는 템플릿 변수를 사용한 경고 쿼리를 지원하지 않습니다. 자세한 내용은 커뮤니티 페이지에서 확인할 수 있습니다. 알림을 설정하는 동안 템플릿 변수는 알림 쿼리에서 지원되지 않습니다.

다차원 규칙에 대한 성능 고려 사항

각 알림 인스턴스는 알림 할당량에 포함됩니다. 알림 할당량 내에서 수용할 수 있는 것보다 많은 인스턴스를 생성하는 다차원 규칙은 평가되지 않으며 할당량 오류를 반환합니다. 자세한 설명은 할당량 도달 오류 섹션을 참조하세요.

다차원 경고는 Grafana 작업 공간의 성능뿐만 아니라 Grafana가 데이터 소스를 쿼리하여 경고 규칙을 평가할 때 데이터 소스의 성능에도 큰 영향을 미칠 수 있습니다. 모니터링 시스템의 성능을 최적화하려는 경우 다음 고려 사항이 유용할 수 있습니다.

  • 규칙 평가 빈도 - 경고 규칙의 모든 평가 속성은 규칙 평가 빈도를 제어합니다. 허용 가능한 가장 낮은 평가 빈도를 사용하는 것이 좋습니다.

  • 결과 세트 카디널리티 — 규칙을 사용하여 생성하는 경고 인스턴스의 수가 성능에 영향을 줍니다. 플릿의 모든 VM에서 모든 API 경로에 대한 API 응답 오류를 모니터링한다고 가정해 보겠습니다. 이 세트에는 경로 수에 VM 수를 곱한 카디널리티가 있습니다. 예를 들어 VM별 경로별 대신 VM별 총 오류를 모니터링하여 결과 집합의 카디널리티를 줄일 수 있습니다.

  • 쿼리의 복잡성 — 데이터 소스가 신속하게 처리하고 응답할 수 있는 쿼리는 리소스를 덜 사용합니다. 이 고려 사항이 위에 나열된 다른 고려 사항보다 덜 중요하긴 하지만 이러한 고려 사항을 최대한 줄였다면 개별 쿼리 성능을 살펴보는 것이 차이를 만들 수 있습니다. 또한 이러한 규칙을 평가하는 것이 데이터 원본에 미치는 성능 영향을 알고 있어야 합니다. 알림 쿼리는 모니터링 데이터베이스에서 처리되는 대부분의 쿼리인 경우가 많으므로 Grafana 인스턴스에 영향을 미치는 동일한 로드 팩터가 알림 쿼리에도 영향을 미칩니다.

할당량 도달 오류

단일 작업 영역 내에 포함할 수 있는 경고 인스턴스 수에는 할당량이 있습니다. 이 수에 도달하면 해당 작업 영역에서 더 이상 새 알림 규칙을 만들 수 없습니다. 다차원 경고의 경우 경고 인스턴스의 수는 시간이 지남에 따라 달라질 수 있습니다.

경고 인스턴스로 작업할 때 다음 사항을 기억해야 합니다.

  • 1차원 규칙만 생성하는 경우 각 규칙은 단일 경고 인스턴스가 됩니다. 알림 인스턴스 할당량과 동일한 수의 규칙을 단일 작업 영역에 생성할 수 있으며 그 이상은 만들 수 없습니다.

  • 다차원 규칙은 여러 경고 인스턴스를 생성하지만 평가 전에는 그 수를 알 수 없습니다. 예를 들어 Amazon EC2 인스턴스의 CPU 사용량을 추적하는 알림 규칙을 생성하면 생성 시 EC2 인스턴스가 50개 (즉, 경고 인스턴스 50개) 있을 수 있지만, 일주일 후에 EC2 인스턴스 10개를 더 추가하면 다음 평가 시 경고 인스턴스가 60개일 수 있습니다.

    알림 인스턴스의 수는 다차원 알림을 생성할 때 평가되며 알림 인스턴스 할당량을 즉시 초과하는 인스턴스를 생성할 수는 없습니다. 알림 인스턴스의 수는 변경될 수 있으므로 규칙을 평가할 때마다 할당량을 확인합니다.

  • 규칙 평가 시 규칙으로 인해 경고 인스턴스의 할당량을 초과한 경우 총 경고 인스턴스 수가 서비스 할당량 이하로 되도록 경고 규칙을 업데이트하기 전까지는 해당 규칙이 평가되지 않습니다. 이 경우 할당량에 도달했음을 알리는 경고 알림을 받게 됩니다. 알림은 평가 대상 규칙에 대한 알림 정책을 사용합니다. 알림에는 값이 있는 Error 주석이 포함되어 있습니다. QuotaReachedError

  • 평가를 QuotaReachedError 중단시키는 규칙. 업데이트가 수행된 경우에만 평가가 재개되며 업데이트 후 평가 자체로 QuotaReachedError a가 발생하지 않습니다. 평가되지 않는 규칙은 Grafana 콘솔에서 할당량 도달 오류를 표시합니다.

  • 경고 규칙을 제거하거나 경고 인스턴스 수를 줄이도록 다차원 경고를 편집하여 알림 인스턴스 수를 줄일 수 있습니다 (예: VM에서 API당 오류에 대한 경고 하나가 아니라 VM당 하나의 오류에 대한 경고를 표시하는 방법).

  • 평가를 재개하려면 알림을 업데이트하고 저장하십시오. 알림 인스턴스 수를 줄이도록 업데이트하거나 알림 인스턴스 수를 줄이기 위해 다른 변경을 수행한 경우 변경 없이 저장할 수 있습니다. 재개할 수 있다면 재개할 수 있습니다. 이로 인해 다른 QuotaReachedError 문제가 발생하면 저장할 수 없습니다.

  • 알림이 저장되고 경고 할당량을 초과하지 않고 평가를 재개하면 할당량 도달 오류가 Grafana 콘솔에 일정 시간 (평가 간격까지) 계속 표시될 수 있지만 경고 규칙 평가가 시작되고 규칙 임계값이 충족되면 경고가 전송됩니다.

  • 알림 할당량 및 기타 할당량에 대한 자세한 내용은 을 참조하십시오. 아마존 매니지드 Grafana 서비스 할당량

데이터 없음 또는 오류 사례 처리

데이터가 없거나 오류가 있을 때 알림 동작을 처리하는 방법에 대한 옵션을 선택합니다.

데이터 없음 처리 옵션은 다음 표에 나열되어 있습니다.

데이터 없음 옵션 동작

데이터 없음

알림 규칙의 이름과 UID, DatasourceNoData 레이블로 데이터를 반환하지 않은 데이터 소스의 UID를 사용하여 알림을 생성합니다.

알림

알림 규칙 상태를 로 설정합니다. Alerting

정상

경고 규칙 상태를 로 설정합니다Normal.

오류 사례 처리 옵션은 다음 표에 나열되어 있습니다.

오류 또는 타임아웃 옵션 동작

알림

경고 규칙 상태를 다음과 같이 설정합니다. Alerting

정상

경고 규칙 상태를 다음과 같이 설정합니다. Normal

오류

경고 규칙의 이름과 UID, DatasourceError 레이블로 데이터를 반환하지 않은 데이터 원본의 UID를 사용하여 알림을 생성합니다.