OPS10-BP07 Otomatiskan tanggapan terhadap acara

Mengotomatiskan respons peristiwa sangatlah penting untuk penanganan operasional yang cepat, konsisten, dan bebas kesalahan. Ciptakan proses yang efisien dan gunakan alat untuk mengelola dan merespons peristiwa secara otomatis, sehingga meminimalkan intervensi manual dan meningkatkan efektivitas operasional.

Hasil yang diinginkan:

Mengurangi kesalahan manusia dan waktu resolusi yang lebih cepat melalui otomatisasi.
Penanganan peristiwa operasional yang konsisten dan andal.
Peningkatan efisiensi operasional dan keandalan sistem.

Anti-pola umum:

Penanganan peristiwa secara manual menyebabkan terjadinya penundaan dan kesalahan.
Otomatisasi diabaikan dalam tugas-tugas penting yang repetitif.
Tugas manual yang repetitif menyebabkan kewalahan akibat peringatan dan terlewatkannya masalah-masalah kritis.

Manfaat menjalankan praktik terbaik ini:

Respons peristiwa yang lebih cepat, sehingga mengurangi waktu henti sistem.
Operasi yang andal dengan penanganan peristiwa yang otomatis dan konsisten.

Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan: Sedang

Panduan implementasi

Integrasikan otomatisasi untuk menciptakan alur kerja operasional yang efisien dan meminimalkan intervensi manual.

Langkah-langkah implementasi

Identifikasi peluang otomatisasi: Tentukan tugas-tugas repetitif untuk diotomatisasi, seperti remediasi masalah, pengayaan tiket, manajemen kapasitas, penskalaan, deployment, dan pengujian.
Identifikasi perintah-perintah otomatisasi:
- Menilai dan menentukan kondisi atau metrik tertentu yang memulai respons otomatis menggunakan tindakan CloudWatch alarm Amazon.
- Gunakan Amazon EventBridge untuk merespons peristiwa dalam AWS layanan, beban kerja khusus, dan aplikasi SaaS.
- Pertimbangkan peristiwa inisiasi seperti entri log tertentu, ambang metrik kinerja, atau perubahan status sumber daya. AWS
Implementasikan otomatisasi berbasis peristiwa:
- Gunakan runbook AWS Systems Manager Otomasi untuk menyederhanakan tugas pemeliharaan, penerapan, dan remediasi.
- Membuat insiden di Manajer Insiden secara otomatis mengumpulkan dan menambahkan detail tentang AWS sumber daya yang terlibat ke insiden tersebut.
- Secara proaktif memantau kuota menggunakan Monitor Kuota untuk AWS.
- Secara otomatis menyesuaikan kapasitas dengan AWS Auto Scaling untuk menjaga ketersediaan dan kinerja.
- Otomatiskan jaringan pipa pengembangan dengan Amazon. CodeCatalyst
- Uji asap atau terus memantau titik akhir dan APIs menggunakan pemantauan sintetis.
Lakukan mitigasi risiko melalui otomatisasi:
- Menerapkan respons keamanan otomatis untuk mengatasi risiko dengan cepat.
- Gunakan AWS Systems Manager State Manager untuk mengurangi penyimpangan konfigurasi.
- Memperbaiki sumber daya yang tidak sesuai dengan. Aturan AWS Config

Tingkat upaya untuk rencana implementasi: Tinggi

Sumber daya

Praktik-praktik terbaik terkait:

Dokumen terkait:

Video terkait:

Contoh terkait:

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

OPS10-BP06 Mengomunikasikan status melalui dasbor

Kembangkan