Konfigurasikan aturan peringatan terkelola Grafana - Amazon Managed Grafana

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Konfigurasikan aturan peringatan terkelola Grafana

Topik dokumentasi ini dirancang untuk ruang kerja Grafana yang mendukung Grafana versi 10.x.

Untuk ruang kerja Grafana yang mendukung Grafana versi 9.x, lihat. Bekerja di Grafana versi 9

Untuk ruang kerja Grafana yang mendukung Grafana versi 8.x, lihat. Bekerja di Grafana versi 8

Aturan yang dikelola Grafana adalah jenis aturan peringatan yang paling fleksibel. Mereka memungkinkan Anda membuat peringatan yang dapat bertindak berdasarkan data dari sumber data kami yang didukung. Selain mendukung beberapa sumber data, Anda juga dapat menambahkan ekspresi untuk mengubah data Anda dan mengatur kondisi peringatan. Menggunakan gambar dalam pemberitahuan peringatan juga didukung. Ini adalah satu-satunya jenis aturan yang memungkinkan peringatan dari beberapa sumber data dalam satu definisi aturan.

Beberapa instance peringatan dapat dibuat sebagai hasil dari satu aturan peringatan (juga dikenal sebagai peringatan multi-dimensi).

Aturan peringatan terkelola Grafana hanya dapat diedit atau dihapus oleh pengguna dengan izin Edit untuk folder yang menyimpan aturan.

Jika Anda menghapus sumber peringatan yang dibuat di UI, Anda tidak dapat mengambilnya lagi. Untuk membuat cadangan konfigurasi Anda dan untuk dapat memulihkan sumber daya peringatan yang dihapus, buat sumber daya peringatan Anda menggunakan Terraform, atau API Peringatan.

Dalam prosedur berikut, kami akan melalui proses pembuatan aturan peringatan yang dikelola Grafana Anda.

Untuk membuat aturan peringatan yang dikelola Grafana, gunakan alur pembuatan peringatan di ruang kerja dan ikuti langkah-langkah berikut untuk membantu Anda.

Tetapkan nama aturan peringatan
  1. Pilih Peringatan & IRM -> Aturan peringatan -> + Aturan peringatan baru.

  2. Masukkan nama untuk mengidentifikasi aturan peringatan Anda.

    Nama ini ditampilkan dalam daftar aturan peringatan. Ini juga merupakan alertname label untuk setiap instance peringatan yang dibuat dari aturan ini.

Selanjutnya, tentukan kueri untuk mendapatkan data yang ingin Anda ukur dan kondisi yang perlu dipenuhi sebelum aturan peringatan diaktifkan.

Untuk menentukan query dan kondisi
  1. Pilih sumber data.

  2. Dari pilihan dropdown, tentukan rentang waktu.

    catatan

    Grafana Alerting hanya mendukung rentang waktu relatif tetap, misalnya,. now-24hr: now

    Ini tidak mendukung rentang waktu absolut: 2021-12-02 00:00:00 to 2021-12-05 23:59:592 atau rentang waktu semi-relatif:now/d to: now.

  3. Tambahkan kueri.

    Untuk menambahkan beberapa kueri, pilih Tambahkan kueri.

    Semua aturan peringatan dikelola oleh Grafana secara default. Jika Anda ingin beralih ke aturan peringatan yang dikelola sumber data, klik Beralih ke aturan peringatan yang dikelola sumber data.

  4. Tambahkan satu atau lebih ekspresi.

    1. Untuk setiap ekspresi, pilih salah satu kondisi Klasik untuk membuat aturan peringatan tunggal, atau pilih dari opsi Matematika, Kurangi, dan Sampel Ulang untuk menghasilkan peringatan terpisah untuk setiap seri.

      catatan

      Saat menggunakan Prometheus, Anda dapat menggunakan vektor instan dan fungsi bawaan, jadi Anda tidak perlu menambahkan ekspresi tambahan.

    2. Pilih Pratinjau untuk memverifikasi bahwa ekspresi berhasil.

  5. [Opsional] Untuk menambahkan ambang pemulihan, aktifkan ambang pemulihan kustom dan isi nilai kapan aturan peringatan Anda harus berhenti diaktifkan.

    Anda hanya dapat menambahkan satu ambang pemulihan dalam kueri dan itu harus menjadi kondisi peringatan.

  6. Pilih Tetapkan sebagai kondisi peringatan pada kueri atau ekspresi yang ingin Anda tetapkan sebagai kondisi peringatan Anda.

Gunakan evaluasi aturan peringatan untuk menentukan seberapa sering aturan peringatan harus dievaluasi dan seberapa cepat aturan tersebut harus mengubah statusnya.

Untuk melakukan ini, Anda perlu memastikan bahwa aturan peringatan Anda berada di grup evaluasi yang tepat dan menetapkan waktu periode tertunda yang paling sesuai untuk kasus penggunaan Anda.

Untuk mengatur perilaku evaluasi peringatan
  1. Pilih folder atau pilih + Folder baru.

  2. Pilih grup evaluasi atau klik + Grup evaluasi baru.

    Jika Anda membuat grup evaluasi baru, tentukan interval untuk grup.

    Semua aturan dalam kelompok yang sama dievaluasi secara bersamaan selama interval waktu yang sama.

  3. Masukkan periode yang tertunda.

    Periode yang tertunda adalah periode di mana aturan peringatan dapat melanggar kondisi sampai menyala.

    Setelah kondisi terpenuhi, peringatan masuk ke status Pending. Jika kondisi tetap aktif selama durasi yang ditentukan, peringatan akan beralih ke status Firing, jika tidak maka akan kembali ke keadaan Normal.

  4. Aktifkan notifikasi peringatan jeda, jika diperlukan.

    catatan

    Jeda evaluasi aturan peringatan untuk mencegah peringatan berisik saat menyetel peringatan Anda. Menjeda menghentikan evaluasi aturan peringatan dan tidak membuat instance peringatan apa pun. Ini berbeda dengan pengaturan waktu bisu, yang menghentikan pemberitahuan agar tidak dikirimkan, tetapi masih memungkinkan evaluasi aturan peringatan dan pembuatan instance peringatan.

    Anda dapat menjeda evaluasi aturan peringatan untuk mencegah peringatan berisik saat menyetel peringatan Anda. Menjeda menghentikan evaluasi aturan peringatan dan tidak membuat instance peringatan apa pun. Ini berbeda dengan pengaturan waktu bisu, yang menghentikan pemberitahuan agar tidak dikirimkan, tetapi masih memungkinkan evaluasi aturan peringatan dan pembuatan instance peringatan.

  5. Di Konfigurasikan tidak ada data dan penanganan kesalahan, konfigurasikan perilaku peringatan tanpa adanya data.

    Gunakan pedoman nanti di bagian ini.

Tambahkan label ke aturan peringatan Anda untuk menetapkan kebijakan notifikasi mana yang harus menangani instance peringatan pengaktifan Anda.

Semua aturan dan instance peringatan, terlepas dari labelnya, cocok dengan kebijakan pemberitahuan default. Jika tidak ada kebijakan bersarang, atau tidak ada kebijakan bersarang yang cocok dengan label dalam aturan peringatan atau instance peringatan, maka kebijakan notifikasi default adalah kebijakan yang cocok.

Untuk mengonfigurasi notifikasi
  1. Tambahkan label jika Anda ingin mengubah cara pemberitahuan Anda dirutekan.

    Tambahkan label khusus dengan memilih pasangan kunci-nilai yang ada dari drop-down, atau tambahkan label baru dengan memasukkan kunci atau nilai baru.

  2. Pratinjau pengaturan perutean instance peringatan Anda.

    Berdasarkan label yang ditambahkan, instance peringatan dirutekan ke kebijakan notifikasi yang ditampilkan.

    Perluas setiap kebijakan pemberitahuan untuk melihat detail selengkapnya.

  3. Pilih Lihat detail untuk melihat detail perutean peringatan dan pratinjau.

Tambahkan anotasi untuk memberikan lebih banyak konteks pada peringatan dalam pesan pemberitahuan peringatan Anda.

Anotasi menambahkan metadata untuk memberikan informasi lebih lanjut tentang peringatan dalam pesan pemberitahuan peringatan Anda. Misalnya, tambahkan anotasi Ringkasan untuk memberi tahu Anda nilai mana yang menyebabkan peringatan diaktifkan atau server mana itu terjadi.

Untuk menambahkan anotasi
  1. [Opsional] Tambahkan ringkasan.

    Ringkasan singkat tentang apa yang terjadi dan mengapa.

  2. [Opsional] Tambahkan deskripsi.

    Deskripsi tentang apa yang dilakukan aturan peringatan.

  3. [Opsional] Tambahkan URL Runbook.

    Halaman web tempat Anda menyimpan runbook untuk peringatan

  4. [Opsional] Tambahkan anotasi khusus

  5. [Opsional] Tambahkan dasbor dan tautan panel.

    Menautkan peringatan ke panel di dasbor.

  6. Pilih Simpan aturan.

Aturan tunggal dan multi-dimensi

Untuk peringatan terkelola Grafana, Anda dapat membuat aturan dengan kondisi klasik atau Anda dapat membuat aturan multi-dimensi.

  • Aturan dengan kondisi klasik

    Gunakan ekspresi kondisi klasik untuk membuat aturan yang memicu peringatan tunggal saat kondisinya terpenuhi. Untuk kueri yang mengembalikan beberapa seri, Grafana tidak melacak status peringatan setiap seri. Akibatnya, Grafana hanya mengirimkan satu peringatan bahkan ketika kondisi peringatan terpenuhi untuk beberapa seri.

  • Aturan multi-dimensi

    Untuk menghasilkan peringatan terpisah untuk setiap seri, buat aturan multi-dimensi. GunakanMath,Reduce, atau Resample ekspresi untuk membuat aturan multi-dimensi. Sebagai contoh:

    • Tambahkan Reduce ekspresi untuk setiap kueri ke nilai agregat dalam rentang waktu yang dipilih menjadi satu nilai (tidak diperlukan untuk aturan yang menggunakan data numerik).

    • Tambahkan Math ekspresi dengan kondisi untuk aturan. Tidak diperlukan jika kueri atau ekspresi pengurangan sudah mengembalikan 0 if rule tidak boleh diaktifkan, atau angka positif jika harus diaktifkan. Beberapa contoh: $B > 70 jika harus diaktifkan dalam nilai kasus B kueri/ekspresi lebih dari 70. $B < $C * 100dalam hal itu harus menyala jika nilai B kurang dari nilai C dikalikan dengan 100. Jika kueri yang dibandingkan memiliki beberapa seri dalam hasilnya, seri dari kueri yang berbeda dicocokkan jika mereka memiliki label yang sama atau satu adalah bagian dari yang lain.

catatan

Grafana tidak mendukung kueri peringatan dengan variabel template. Informasi lebih lanjut tersedia di https://community.grafana.com/t/ template-variables-are-not - supported-in-alert-queries - while-setting-up-alert /2514.

Konfigurasikan tidak ada data dan penanganan kesalahan

Konfigurasikan perilaku peringatan saat evaluasi aturan peringatan Anda tidak menampilkan data atau kesalahan.

catatan

Aturan peringatan yang dikonfigurasi untuk diaktifkan ketika evaluasi tidak mengembalikan data atau kesalahan hanya menyala ketika seluruh durasi periode evaluasi telah selesai. Ini berarti bahwa alih-alih segera menyala ketika kondisi aturan peringatan dilanggar, aturan peringatan menunggu hingga waktu yang ditetapkan sebagai bidang For telah selesai dan kemudian menyala, mengurangi kebisingan peringatan dan memungkinkan masalah ketersediaan data sementara.

Jika evaluasi aturan peringatan Anda tidak mengembalikan data, Anda dapat mengatur status pada aturan peringatan Anda untuk muncul sebagai berikut:

Tidak ada Data Deskripsi
Tidak ada Data Membuat peringatan baru DatasourceNoData dengan nama dan UID aturan peringatan, dan UID sumber data yang tidak mengembalikan data sebagai label.
Peringatan Menetapkan status aturan peringatan keAlerting. Aturan peringatan menunggu sampai waktu yang ditetapkan di bidang For telah selesai sebelum ditembakkan.
Oke Menetapkan status aturan peringatan keNormal.

Jika evaluasi Anda menampilkan kesalahan, Anda dapat mengatur status pada aturan peringatan Anda untuk muncul sebagai berikut:

Kesalahan Deskripsi
Kesalahan Membuat instance peringatan DatasourceError dengan nama dan UID dari aturan peringatan, dan UID sumber data yang tidak mengembalikan data sebagai label.
Peringatan Menetapkan status aturan peringatan keAlerting. Aturan peringatan menunggu sampai waktu yang ditetapkan di bidang For telah selesai sebelum ditembakkan.
Oke Menetapkan status aturan peringatan keNormal.

Selesaikan contoh peringatan basi

Instance peringatan dianggap basi jika dimensi atau deretnya telah hilang dari hasil kueri seluruhnya selama dua interval evaluasi.

Instance peringatan basi yang berada di Error statusAlerting/NoData/secara otomatis ditandai sebagai Resolved dan grafana_state_reason anotasi ditambahkan ke instance peringatan dengan alasannya. MissingSeries

Buat peringatan dari panel

Buat peringatan dari jenis panel apa pun. Ini berarti Anda dapat menggunakan kembali kueri di panel dan membuat peringatan berdasarkan pada mereka.

  1. Arahkan ke dasbor di bagian Dasbor.

  2. Di sudut kanan atas panel, pilih tiga titik (elips).

  3. Dari menu tarik-turun, pilih Lainnya... dan kemudian pilih Aturan peringatan baru.

Ini akan membuka formulir aturan peringatan, memungkinkan Anda untuk mengkonfigurasi dan membuat peringatan Anda berdasarkan kueri panel saat ini.