Membuat sebuah alarm berdasarkan pada sumber data yang terhubung - Amazon CloudWatch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Membuat sebuah alarm berdasarkan pada sumber data yang terhubung

Anda dapat membuat alarm yang melihat metrik dari sumber data yang tidak ada. CloudWatch Untuk informasi selengkapnya mengenai cara membuat koneksi ke sumber data lainnya, silakan lihat Metrik kueri dari sumber data lain.

Cara membuat sebuah alarm berdasarkan metrik dari sumber data yang telah Anda sambungkan
  1. Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/.

  2. Pada panel navigasi, silakan pilih Metrik, Semua metrik.

  3. Pilih tab Kueri multi sumber.

  4. Untuk Sumber data, silakan pilih sumber data yang ingin Anda gunakan.

  5. Pembuat kueri akan meminta Anda untuk memberikan informasi yang diperlukan untuk kueri agar bisa mengambil metrik yang akan digunakan untuk alarm. Alur kerjanya akan berbeda untuk masing-masing sumber data, dan akan disesuaikan dengan sumber data. Sebagai contoh, untuk Layanan Terkelola Amazon untuk Prometheus dan sumber data Prometheus, kotak editor kueri PromQL dengan pembantu kueri akan ditampilkan.

  6. Setelah Anda selesai membuat konsep kueri tersebut, silakan pilih Buat grafik kueri.

  7. Jika grafik sampel sudah terlihat seperti yang Anda harapkan, silakan pilih Buat alarm.

  8. Kemudian akan muncul halaman Tentukan metrik dan kondisi. Jika kueri yang Anda gunakan menghasilkan lebih dari satu deret waktu, maka Anda akan muncul banner peringatan di bagian atas halaman. Jika banner peringatan itu muncul, silakan pilih fungsi yang akan digunakan untuk menggabungkan deret waktu dalam fungsi Agregasi.

  9. (Opsional) Tambahkan sebuah Label untuk alarm.

  10. Untuk Kapanpun your-metric-name. , pilih Lebih Besar, Lebih Hebat/Sama, Lebih Rendah/Sama, atau Lebih Rendah. Kemudian untuk dari . . ., masukkan angka untuk nilai ambang batas Anda.

  11. Pilih Konfigurasi tambahan. Untuk Titik data alarm, tentukan berapa banyak periode evaluasi (titik data) yang harus ada dalam status ALARM untuk memicu alarm. Jika kedua nilai di sini cocok, Anda membuat alarm yang beralih ke status ALARM jika terjadi pelanggaran selama sebanyak itu dalam periode berturut-turut.

    Untuk membuat sebuah alarm M dari N, Anda harus menentukan angka untuk nilai pertama dengan nilai yang lebih rendah dari angka untuk nilai kedua. Untuk informasi selengkapnya, lihat Melakukan evaluasi alarm.

  12. Untuk Perlakuan data yang hilang, pilih perilaku alarm ketika ada beberapa titik data yang hilang. Untuk informasi selengkapnya, lihat Mengkonfigurasi bagaimana CloudWatch alarm memperlakukan data yang hilang.

  13. Pilih Berikutnya.

  14. Untuk Notifikasi, Anda perlu menentukan topik Amazon SNS yang akan mendapatkan notifikasi saat alarm statusnya beralih menjadi ALARM, OK atau INSUFFICIENT_DATA.

    1. (Opsional) Untuk mengirimkan beberapa notifikasi untuk status alarm yang sama atau status alarm yang berbeda, silakan pilih Tambahkan notifikasi.

      catatan

      Kami menyarankan Anda untuk menyetel alarm untuk mengambil tindakan ketika alarm beralih statusnya menjadi data tidak mencukupi selain ketika beralih status menjadi Alarm. Hal ini dilakukan karena banyak masalah dengan fungsi Lambda yang terhubung ke sumber data yang dapat menyebabkan alarm beralih statusnya menjadi Data tidak mencukupi.

    2. (Opsional) Jika tidak ingin mengirimkan notifikasi Amazon SNS, silakan pilih Hapus.

  15. Agar alarm dapat melakukan tindakan penskalaan otomatis, EC2, Lambda atau Systems Manager, pilih tombol yang sesuai dan pilih status alarm serta tindakan yang harus dilakukan. Jika Anda memilih sebuah fungsi Lambda sebagai tindakan alarm, maka Anda menentukan nama fungsi atau ARN, dan Anda dapat memilih versi tertentu dari fungsi tersebut secara opsional.

    Alarm dapat melakukan tindakan Systems Manager hanya ketika masuk ke status ALARM. Untuk informasi selengkapnya tentang tindakan Systems Manager, lihat Mengkonfigurasi CloudWatch untuk membuat OpsItems dari alarm dan pembuatan Insiden.

    catatan

    Untuk membuat alarm yang melakukan tindakan SSM Incident Manager, Anda harus memiliki izin tertentu. Untuk informasi selengkapnya, lihat contoh kebijakan berbasis identitas untuk Manajer Insiden AWS Systems Manager.

  16. Pilih Berikutnya.

  17. Pada Nama dan deskripsi, Anda harus memasukkan nama dan deskripsi untuk alarm Anda, dan kemudian pilih Berikutnya. Nama tersebut harus menggunakan karakter UTF-8, dan tidak dapat berisi karakter kontrol ASCII. Deskripsi dapat mencakup pemformatan penurunan harga, yang hanya ditampilkan di tab Detail alarm di CloudWatch konsol. Penurunan harga dapat Anda gunakan untuk menambahkan tautan ke runbook atau sumber daya internal lainnya.

    Tip

    Nama alarm harus menggunakan karakter UTF-8 saja. Nama tersebut tidak boleh memuat karakter kontrol ASCII.

  18. Pada Pratinjau dan buat, silakan Anda konfirmasi bahwa informasi dan kondisi alarm Anda sudah benar, dan kemudian pilih Buat alarm.

Detail mengenai alarm untuk sumber data yang terhubung

  • Ketika CloudWatch mengevaluasi alarm, ia melakukannya setiap menit, bahkan jika periode untuk alarm lebih dari satu menit. Agar alarm berfungsi, fungsi Lambda harus dapat mengembalikan daftar stempel waktu yang dimulai setiap menit, tidak hanya pada kelipatan panjang periode. Stempel waktu ini harus diberi jarak satu periode.

    Oleh karena itu, jika sumber data yang dikueri oleh Lambda hanya dapat mengembalikan stempel waktu yang merupakan kelipatan dari panjang periode, maka fungsi tersebut harus "mengambil sampel ulang" data yang diambil agar sesuai dengan stempel waktu yang diharapkan oleh permintaan GetMetricData.

    Sebagai contoh, sebuah alarm dengan periode lima menit akan dievaluasi setiap menit dengan menggunakan jendela lima menit yang bergeser satu menit setiap kali. Dalam kasus ini:

    • Untuk evaluasi alarm pada 12:15:00, CloudWatch mengharapkan titik data dengan stempel waktu,, dan. 12:00:00 12:05:00 12:10:00

    • Kemudian untuk evaluasi alarm pada 12:16:00, CloudWatch mengharapkan titik data dengan stempel waktu,, dan. 12:01:00 12:06:00 12:11:00

  • Saat CloudWatch mengevaluasi alarm, titik data apa pun yang dikembalikan oleh fungsi Lambda yang tidak sejajar dengan stempel waktu yang diharapkan akan dijatuhkan, dan alarm dievaluasi menggunakan titik data yang diharapkan yang tersisa. Sebagai contoh, ketika alarm dievaluasi pada 12:15:00, itu akan mengharapkan data dengan stempel waktu 12:00:00, 12:05:00, dan 12:10:00. Jika menerima data dengan stempel waktu12:00:00,,12:05:00, dan 12:06:0012:10:00, data dari 12:06:00 dijatuhkan dan CloudWatch mengevaluasi alarm menggunakan stempel waktu lainnya.

    Kemudian untuk evaluasi berikutnya pada 12:16:00, ia akan mengharapkan data dengan stempel waktu 12:01:00, 12:06:00, dan 12:11:00. Jika ia hanya memiliki data dengan stempel waktu 12:00:00, 12:05:00, dan 12:10:00, maka semua titik data ini akan diabaikan pada 12:16:00 dan alarm akan beralih status sesuai dengan pengaturan yang Anda tetapkan untuk alarm ketika menangani data yang hilang. Untuk informasi selengkapnya, lihat Melakukan evaluasi alarm.

  • Kami menyarankan Anda untuk membuat alarm ini agar melakukan tindakan saat beralih statusnya menjadi INSUFFICIENT_DATA, karena beberapa kasus penggunaan fungsi Lambda yang gagal akan mengubah status alarm menjadi INSUFFICIENT_DATA terlepas dari pengaturan yang Anda tentukan untuk alarm ketika menangani data yang hilang.

  • Jika fungsi Lambda mengembalikan kesalahan atau mengembalikan sebagian data:

    • Jika ada permasalahan izin ketika memanggil fungsi Lambda, alarm akan mulai memiliki transisi data yang hilang sesuai dengan pengaturan yang Anda tentukan untuk alarm ketika menangani data yang hilang saat Anda membuatnya.

    • Jika fungsi Lambda mengembalikan 'StatusCode' = 'PartialData', artinya evaluasi alarm mengalami kegagalan, dan alarm tersebut beralih statusnya menjadi INSUFFICIENT_DATA setelah tiga upaya, Hal ini memakan waktu sekitar tiga menit.

    • Kesalahan-kesalahan lain yang berasal dari fungsi Lambda akan menyebabkan alarm beralih statusnya menjadi INSUFFICIENT_DATA.

  • Jika metrik yang diminta oleh fungsi Lambda mengalami beberapa penundaan sehingga titik data terakhir selalu hilang, maka Anda harus menggunakan sebuah solusi untuk menyelesaikannya. Anda dapat membuat sebuah alarm M dari N atau dapat menaikkan periode evaluasi alarm. Untuk informasi selengkapnya tentang alarm M dari N, silakan lihat Melakukan evaluasi alarm.