Praktik terbaik untuk pemantauan AWS CloudHSM - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Praktik terbaik untuk pemantauan AWS CloudHSM

Memantau praktik terbaik dapat meningkatkan keamanan, kinerja, dan keandalan AWS CloudHSM klaster Anda. Ikuti praktik terbaik AWS CloudHSM pemantauan dalam AWS CloudHSM dokumentasi. Selain itu, berikut ini adalah beberapa pedoman utama yang dapat membantu Anda memantau AWS CloudHSM sumber daya Anda secara efektif:

  • Tetapkan baseline — Tetapkan metrik dasar dan ambang batas untuk setiap beban kerja, seperti jumlah kunci sesi yang diharapkan, kunci token, dan sesi terbuka.

  • Peringatan saat hasil beban kerja berisiko — Konfigurasikan CloudWatch alarm Amazon untuk memulai notifikasi saat metrik beban kerja melebihi ambang batas yang ditetapkan. Peringatan ini harus memberi tahu Anda tentang masalah operasional atau kinerja atau potensi risiko keamanan, seperti aktivitas berbahaya.

  • Tinjau dan revisi metrik — Tinjau data pemantauan secara teratur untuk menilai efektivitas metrik yang Anda buat. Metrik harus mencerminkan kesehatan dan kinerja AWS CloudHSM cluster Anda. Sesuaikan metrik berdasarkan pola beban kerja yang berkembang dan persyaratan operasional. Ini mempromosikan kemampuan pemantauan dan peringatan yang optimal.

Rekomendasi pemantauan dan peringatan untuk AWS CloudHSM dalam panduan ini mengikuti praktik terbaik dalam pilar Kerangka Kerja AWS Well-Architected berikut:

  • Pilar keunggulan operasional merekomendasikan bahwa beban kerja Anda harus dirancang untuk mencakup telemetri dan pemantauan. AWS CloudHSM menyediakan informasi yang diperlukan, seperti metrik, log, peristiwa, dan jejak, agar Anda dapat memahami keadaan sumber daya Anda. Untuk informasi selengkapnya, lihat Pemantauan AWS CloudHSM dalam AWS CloudHSM dokumentasi. Ketika Anda beroperasi AWS CloudHSM, Anda harus dapat memahami kesehatan klaster, mendeteksi peristiwa operasional, dan menanggapi peristiwa yang direncanakan dan tidak direncanakan. AWS menyediakan alat pemantauan yang membantu Anda menentukan kapan hasil organisasi dan bisnis mungkin berisiko sehingga Anda dapat mengambil tindakan yang tepat pada waktu yang tepat.

  • Pilar efisiensi kinerja merekomendasikan agar Anda memantau kinerja sumber daya Anda, seperti AWS CloudHSM cluster, dengan mengumpulkan, menggabungkan, dan memproses metrik terkait kinerja dalam waktu dekat. Anda dapat mengidentifikasi degradasi kinerja dan memulihkan faktor-faktor tersebut. Misalnya, Anda mungkin mendeteksi modul keamanan perangkat keras (HSMs) di klaster yang melaporkan kesalahan sisi server. Anda dapat menaikkan alarm secara otomatis saat pengukuran berada di luar ambang batas yang diharapkan. Kami menyarankan Anda menggunakan alarm tidak hanya untuk notifikasi, tetapi juga untuk memulai tindakan otomatis sebagai respons terhadap peristiwa yang terdeteksi. Misalnya, Anda dapat mengotomatiskan peningkatan jumlah HSMs di cluster.

  • Pilar keandalan mendefinisikan pemantauan dan peringatan sebagai hal penting untuk memastikan bahwa Anda memenuhi persyaratan ketersediaan Anda. Solusi pemantauan Anda harus dapat mendeteksi kegagalan secara efektif. Ketika mendeteksi masalah atau kegagalan, tujuan utamanya adalah untuk memperingatkan masalah tersebut. Menerapkan praktik observabilitas dan pemantauan berkelanjutan sangat penting untuk arsitektur tangguh di cloud. Untuk meningkatkan beban kerja Anda, Anda harus dapat mengukurnya dan memahami keadaan dan kesehatannya. Prinsip desain untuk pemulihan otomatis dari kegagalan, skalabilitas horizontal, dan penyediaan kapasitas bergantung pada layanan pemantauan dan peringatan yang akurat.

  • Pilar keamanan membahas deteksi dan pencegahan perubahan konfigurasi yang tidak terduga atau tidak diinginkan dan perilaku yang tidak terduga. Secara default, AWS CloudHSM mengumpulkan log audit HSM Anda dan mengirimkannya ke Amazon CloudWatch Logs atas nama Anda. Anda dapat menggunakan log audit untuk memantau operasi yang dilakukan dalam setiap HSM di cluster.