Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pemantauan AWS CloudHSM dengan menggunakan metrik, log audit, dan alarm
Shubhansu Sawaria, Amazon Web Services ()AWS
Februari 2025 (riwayat dokumen)
Panduan ini menguraikan alat observabilitas dan pemantauan serta praktik terbaik untuk mengelola klaster. AWS CloudHSM Untuk memantau AWS CloudHSM klaster, Anda mengukur, melacak, dan menilai ketersediaan, kinerja, keamanan, dan fungsionalitasnya.
Pada AWS, Anda dapat menganalisis log beban kerja, metrik, peristiwa, dan jejak untuk memahami kesehatan beban kerja. Ini membantu Anda mendapatkan wawasan operasional dari waktu ke waktu. Pemantauan membantu memastikan bahwa sumber daya berfungsi seperti yang diharapkan sehingga Anda dapat mendeteksi dan secara proaktif mengatasi masalah. Gunakan metrik, log, dan peristiwa yang dipantau untuk menyetel alarm saat ambang batas terlampaui.
Audiens yang dituju
Panduan ini ditujukan untuk arsitek solusi, DevOps insinyur senior, dan anggota tim yang merancang, menerapkan, atau mengelola solusi pemantauan dan observabilitas untuk AWS CloudHSM beban kerja.
Hasil bisnis yang ditargetkan
Dengan menerapkan praktik terbaik pemantauan dan peringatan, Anda dapat membantu mencapai infrastruktur yang berkinerja tinggi, tangguh, efisien, aman, dan dioptimalkan biaya untuk aplikasi dan beban kerja Anda. Praktik terbaik ini memungkinkan pengamatan dan analisis hampir real-time terhadap kesehatan dan kinerja AWS CloudHSM klaster Anda secara keseluruhan.
Pemantauan dan peringatan membantu Anda mencegah degradasi atau gangguan layanan TI terkait. Jika terjadi degradasi yang tidak direncanakan atau gangguan layanan, alat pemantauan dan peringatan dapat memfasilitasi deteksi, eskalasi, reaksi, investigasi, dan resolusi tepat waktu.
Solusi pemantauan dan peringatan yang kuat berkontribusi pada hasil bisnis utama berikut:
-
Meningkatkan pengalaman pelanggan
-
Membangun kepercayaan pelanggan
-
Mengurangi kerugian finansial yang terkait dengan gangguan layanan yang tidak direncanakan
-
Meningkatkan produktivitas pengembang dengan membantu mereka mengidentifikasi dan menyelesaikan masalah dengan lebih cepat
-
Meningkatkan efektivitas dan efisiensi operasional dengan meningkatkan ketersediaan