Grafana 관리형 알림 규칙 구성 - Amazon Managed Grafana

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Grafana 관리형 알림 규칙 구성

이 설명서 항목은 Grafana 버전 10.x를 지원하는 Grafana 작업 영역을 위해 설계되었습니다.

Grafana 버전 9.x를 지원하는 Grafana 작업 영역에 대한 내용은 을 참조하십시오. Grafana 버전 9에서 작업하기

Grafana 버전 8.x를 지원하는 Grafana 작업 영역에 대한 내용은 을 참조하십시오. Grafana 버전 8에서 작업하기

Grafana에서 관리하는 규칙은 가장 유연한 알림 규칙 유형입니다. 이를 통해 지원되는 모든 데이터 소스의 데이터에 대해 조치를 취할 수 있는 알림을 생성할 수 있습니다. 여러 데이터 소스를 지원하는 것 외에도 식을 추가하여 데이터를 변환하고 알림 조건을 설정할 수 있습니다. 경고 알림에서 이미지를 사용하는 것도 지원됩니다. 단일 규칙 정의에서 여러 데이터 소스의 경고를 허용하는 유일한 규칙 유형입니다.

하나의 경고 규칙 (다차원 경고라고도 함) 의 결과로 여러 경고 인스턴스를 만들 수 있습니다.

Grafana 관리 알림 규칙은 규칙을 저장하는 폴더에 대한 편집 권한이 있는 사용자만 편집하거나 삭제할 수 있습니다.

UI에서 생성된 알림 리소스를 삭제하면 더 이상 검색할 수 없습니다. 구성을 백업하고 삭제된 알림 리소스를 복원하려면 Terraform 또는 Alerting API를 사용하여 알림 리소스를 생성하십시오.

다음 절차에서는 Grafana에서 관리하는 알림 규칙을 만드는 프로세스를 살펴보겠습니다.

Grafana에서 관리하는 알림 규칙을 만들려면 작업 공간 내 알림 생성 흐름을 사용하고 다음 단계를 따르면 도움이 됩니다.

알림 규칙 이름을 설정합니다.
  1. 경고 및 IRM -> 경고 규칙 -> + 새 경고 규칙을 선택합니다.

  2. 알림 규칙을 식별할 이름을 입력합니다.

    이 이름은 경고 규칙 목록에 표시됩니다. 또한 이 규칙에서 생성되는 모든 경고 인스턴스의 alertname 레이블이기도 합니다.

그런 다음 측정하려는 데이터를 가져오는 쿼리와 경고 규칙이 실행되기 전에 충족해야 하는 조건을 정의하십시오.

쿼리와 조건을 정의하려면
  1. 데이터 소스를 선택합니다.

  2. 옵션 드롭다운에서 시간 범위를 지정합니다.

    참고

    Grafana Alerting은 고정된 상대 시간 범위 (예:) 만 지원합니다. now-24hr: now

    절대 시간 범위 2021-12-02 00:00:00 to 2021-12-05 23:59:592 또는 반상대 시간 범위는 지원하지 않습니다. now/d to: now

  3. 쿼리를 추가하세요.

    쿼리를 여러 개 추가하려면 쿼리 추가를 선택합니다.

    모든 경고 규칙은 기본적으로 Grafana에서 관리합니다. 데이터 소스 관리 알림 규칙으로 전환하려면 데이터 소스 관리 알림 규칙으로 전환을 클릭합니다.

  4. 표현식을 하나 이상 추가합니다.

    1. 각 식에 대해 클래식 조건을 선택하여 단일 경고 규칙을 생성하거나 수학, 축소리샘플링 옵션 중에서 선택하여 시리즈별로 별도의 알림을 생성합니다.

      참고

      Prometheus를 사용하면 인스턴트 벡터와 내장 함수를 사용할 수 있으므로 식을 추가로 추가할 필요가 없습니다.

    2. [미리 보기] 를 선택하여 표현식이 성공했는지 확인하십시오.

  5. [선택 사항] 복구 임계값을 추가하려면 사용자 지정 복구 임계값 토글을 켜고 알림 규칙의 실행을 중지해야 하는 시기에 대한 값을 입력합니다.

    쿼리에는 복구 임계값을 하나만 추가할 수 있으며 이 임계값은 경고 조건이어야 합니다.

  6. 알림 조건으로 설정하려는 쿼리 또는 표현식에서 알림 조건으로 설정을 선택합니다.

경고 규칙 평가를 사용하여 경고 규칙을 평가하는 빈도와 상태를 얼마나 빨리 변경해야 하는지 결정할 수 있습니다.

이렇게 하려면 경고 규칙이 올바른 평가 그룹에 있는지 확인하고 사용 사례에 가장 적합한 보류 기간을 설정해야 합니다.

알림 평가 동작을 설정하려면
  1. 폴더를 선택하거나 + 새 폴더를 선택합니다.

  2. 평가 그룹을 선택하거나 + 새 평가 그룹을 클릭합니다.

    새 평가 그룹을 생성하는 경우 그룹의 간격을 지정하십시오.

    동일한 그룹 내의 모든 규칙이 같은 기간 동안 동시에 평가됩니다.

  3. 보류 기간을 입력합니다.

    보류 기간은 경고 규칙이 실행될 때까지 조건을 위반할 수 있는 기간입니다.

    조건이 충족되면 경고는 보류 상태로 전환됩니다. 지정된 기간 동안 활성 상태를 유지하는 경우 경고는 발생 상태로 전환되고 그렇지 않으면 정상 상태로 되돌아갑니다.

  4. 필요한 경우 알림 일시 중지 기능을 켜십시오.

    참고

    알림을 조정하는 동안 시끄러운 알림이 발생하지 않도록 경고 규칙 평가를 일시 중지하십시오. 일시 중지하면 경고 규칙 평가가 중지되고 경고 인스턴스가 생성되지 않습니다. 이는 알림 전달을 중지하지만 경고 규칙 평가 및 경고 인스턴스 생성을 허용하는 뮤트 타이밍과는 다릅니다.

    알림 규칙 평가를 일시 중지하여 알림을 조정하는 동안 잡음이 발생하는 것을 방지할 수 있습니다. 일시 중지하면 경고 규칙 평가가 중지되고 경고 인스턴스가 생성되지 않습니다. 이는 알림 전달을 중지하지만 경고 규칙 평가 및 경고 인스턴스 생성을 허용하는 뮤트 타이밍과는 다릅니다.

  5. 데이터 없음 구성 및 오류 처리 기능에서 데이터가 없을 때의 알림 동작을 구성하십시오.

    이 섹션의 뒷부분에 있는 지침을 사용하십시오.

경고 규칙에 레이블을 추가하여 경고 인스턴스 발생을 처리해야 하는 알림 정책을 설정합니다.

레이블에 관계없이 모든 경고 규칙 및 인스턴스는 기본 알림 정책과 일치합니다. 중첩된 정책이 없거나 경고 규칙 또는 경고 인스턴스의 레이블과 일치하는 중첩된 정책이 없는 경우 기본 알림 정책은 일치 정책입니다.

알림을 구성하려면
  1. 알림이 라우팅되는 방식을 변경하려면 레이블을 추가하세요.

    드롭다운에서 기존 키-값 쌍을 선택하여 사용자 지정 레이블을 추가하거나 새 키 또는 값을 입력하여 새 레이블을 추가합니다.

  2. 알림 인스턴스 라우팅 설정을 미리 볼 수 있습니다.

    추가된 레이블에 따라 경고 인스턴스는 표시된 알림 정책으로 라우팅됩니다.

    자세한 내용을 보려면 각 알림 정책을 확장하십시오.

  3. 알림 라우팅 세부 정보 및 미리보기를 보려면 세부 정보 보기를 선택합니다.

주석을 추가하여 경고 알림 메시지의 알림에 대한 추가 컨텍스트를 제공합니다.

주석은 메타데이터를 추가하여 경고 알림 메시지의 알림에 대한 추가 정보를 제공합니다. 예를 들어 요약 주석을 추가하여 어떤 값으로 인해 알림이 발생했는지 또는 어떤 서버에서 발생했는지 알 수 있습니다.

주석을 추가하려면
  1. [선택 사항] 요약을 추가합니다.

    발생한 일과 이유에 대한 간략한 요약

  2. [선택 사항] 설명을 추가합니다.

    알림 규칙의 기능에 대한 설명

  3. [선택 사항] 런북 URL을 추가합니다.

    알림에 대한 런북을 보관하는 웹 페이지

  4. [선택 사항] 사용자 지정 주석 추가

  5. [선택 사항] 대시보드 및 패널 링크를 추가합니다.

    대시보드의 패널에 경고를 연결합니다.

  6. 규칙 저장을 선택합니다.

단일 및 다차원 규칙

Grafana 관리 알림의 경우 클래식 조건으로 규칙을 만들거나 다차원 규칙을 만들 수 있습니다.

  • 클래식 조건이 적용된 규칙

    클래식 조건 표현식을 사용하여 조건이 충족될 때 단일 알림을 트리거하는 규칙을 만들 수 있습니다. 여러 시리즈를 반환하는 쿼리의 경우 Grafana는 각 시리즈의 알림 상태를 추적하지 않습니다. 따라서 Grafana는 여러 시리즈의 알림 조건이 충족되는 경우에도 단일 알림만 전송합니다.

  • 다차원 규칙

    각 시리즈에 대해 별도의 알림을 생성하려면 다차원 규칙을 생성하십시오. MathReduce, 또는 Resample 표현식을 사용하여 다차원 규칙을 만들 수 있습니다. 예:

    • 각 쿼리에 Reduce 식을 추가하여 선택한 시간 범위의 값을 단일 값으로 집계합니다 (숫자 데이터를 사용하는 규칙에는 필요 없음).

    • 규칙 조건이 포함된 Math 표현식을 추가합니다. 규칙이 실행되지 않아야 하는 경우 쿼리 또는 reduce 표현식이 이미 0 반환되고, 실행되지 않아야 하는 경우 양수가 반환되는 경우에는 필요하지 않습니다. 몇 가지 예: $B > 70 B 쿼리/표현식의 값이 70을 초과하는 경우 실행되어야 하는지 여부 $B < $C * 100B 값이 C 값에 100을 곱한 값보다 작으면 실행되어야 하는 경우 비교 대상 쿼리 결과에 여러 시리즈가 있는 경우 레이블이 같거나 한 쿼리가 다른 시리즈의 하위 집합이면 서로 다른 쿼리의 시리즈가 일치됩니다.

참고

Grafana는 템플릿 변수를 사용한 경고 쿼리를 지원하지 않습니다. 자세한 내용은 https://community.grafana.com/t/ template-variables-are-not - supported-in-alert-queries - while-setting-up-alert /2514에서 확인할 수 있습니다.

데이터 없음 및 오류 처리를 구성하지 마십시오.

알림 규칙 평가에서 데이터가 없거나 오류가 반환될 때 알림 동작을 구성하십시오.

참고

평가에서 데이터가 없거나 오류가 반환될 때 실행되도록 구성된 경고 규칙은 평가 기간의 전체 기간이 종료된 후에만 실행됩니다. 즉, 경고 규칙 조건이 위반되면 즉시 실행되는 대신 For 필드가 완료될 때까지 알림 규칙이 설정된 시간까지 기다린 다음 실행되므로 경고 소음이 줄어들고 일시적인 데이터 가용성 문제가 발생할 수 있습니다.

경고 규칙 평가 결과 데이터가 반환되지 않는 경우 경고 규칙의 상태가 다음과 같이 표시되도록 설정할 수 있습니다.

데이터 없음 설명
데이터 없음 알림 규칙의 이름과 UID, DatasourceNoData 레이블로 데이터를 반환하지 않은 데이터 소스의 UID를 사용하여 새 알림을 생성합니다.
알림 알림 규칙 상태를 로 설정합니다. Alerting 알림 규칙은 For 필드에 설정된 시간이 끝날 때까지 기다린 후 실행됩니다.
알겠습니다. 경고 규칙 상태를 로 설정합니다Normal.

평가 결과 오류가 반환되는 경우 경고 규칙의 상태가 다음과 같이 나타나도록 설정할 수 있습니다.

Error 설명
Error 경고 규칙의 이름과 UID, DatasourceError 레이블로 데이터를 반환하지 않은 데이터 원본의 UID를 사용하여 경고 인스턴스를 생성합니다.
알림 알림 규칙 상태를 로 설정합니다. Alerting 알림 규칙은 For 필드에 설정된 시간이 끝날 때까지 기다린 후 실행됩니다.
알겠습니다. 경고 규칙 상태를 로 설정합니다Normal.

오래된 경고 인스턴스를 해결합니다.

두 번의 평가 간격 동안 쿼리 결과에서 해당 차원 또는 시리즈가 완전히 사라지면 경고 인스턴스가 유효하지 않은 것으로 간주됩니다.

Alerting/NoData/Error상태인 오래된 경고 인스턴스는 자동으로 로 표시되며 Resolved 이유와 함께 grafana_state_reason 주석이 경고 인스턴스에 추가됩니다. MissingSeries

패널에서 알림을 생성합니다.

모든 패널 유형에서 알림을 만들 수 있습니다. 즉, 패널에서 쿼리를 재사용하고 이를 기반으로 알림을 생성할 수 있습니다.

  1. 대시보드 섹션에서 대시보드로 이동합니다.

  2. 패널 오른쪽 상단에서 세 개의 점 (타원) 을 선택합니다.

  3. 드롭다운 메뉴에서 자세히... 를 선택한 다음 새 알림 규칙을 선택합니다.

그러면 현재 패널의 쿼리를 기반으로 알림을 구성하고 생성할 수 있는 알림 규칙 양식이 열립니다.