Mejores prácticas de monitoreo AWS CloudHSM - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Mejores prácticas de monitoreo AWS CloudHSM

Las mejores prácticas de supervisión pueden mejorar la seguridad, el rendimiento y la fiabilidad de su AWS CloudHSM clúster. Siga las prácticas recomendadas AWS CloudHSM de supervisión que se indican en la AWS CloudHSM documentación. Además, las siguientes son algunas pautas clave que pueden ayudarlo a monitorear sus AWS CloudHSM recursos de manera efectiva:

  • Establezca bases de referencia: establezca métricas y umbrales de referencia para cada carga de trabajo, como la cantidad de claves de sesión esperadas, claves simbólicas y sesiones abiertas.

  • Alerte cuando los resultados de la carga de trabajo estén en riesgo: configure CloudWatch las alarmas de Amazon para iniciar notificaciones cuando las métricas de la carga de trabajo superen los umbrales establecidos. Estas alertas deberían informarle sobre problemas operativos o de rendimiento o sobre posibles riesgos de seguridad, como actividades maliciosas.

  • Revise y revise las métricas: revise periódicamente los datos de monitoreo para evaluar la eficacia de las métricas establecidas. Las métricas deben reflejar el estado y el rendimiento de su AWS CloudHSM clúster. Ajuste las métricas en función de la evolución de los patrones de carga de trabajo y los requisitos operativos. Esto promueve unas capacidades óptimas de supervisión y alerta.

Las recomendaciones de monitoreo y alertas de esta guía siguen AWS CloudHSM las mejores prácticas de los siguientes pilares del AWS Well-Architected Framework:

  • El pilar de la excelencia operativa recomienda que la carga de trabajo se diseñe de manera que incluya la telemetría y la supervisión. AWS CloudHSM proporciona la información necesaria, como métricas, registros, eventos y rastreos, para que pueda comprender el estado de sus recursos. Para obtener más información, consulte Supervisión AWS CloudHSM en la AWS CloudHSM documentación. Cuando opere AWS CloudHSM, debe poder comprender el estado del clúster, detectar los eventos operativos y responder a los eventos planificados y no planificados. AWS proporciona herramientas de supervisión que le ayudan a determinar cuándo pueden estar en riesgo los resultados organizativos y empresariales para que pueda tomar las medidas adecuadas en el momento adecuado.

  • El pilar de la eficiencia del rendimiento recomienda supervisar el rendimiento de los recursos, como los AWS CloudHSM clústeres, mediante la recopilación, la agregación y el procesamiento de las métricas relacionadas con el rendimiento prácticamente en tiempo real. Puede identificar la degradación del rendimiento y corregir los factores. Por ejemplo, puede detectar módulos de seguridad de hardware (HSMs) en el clúster que notifican errores en el servidor. Puede activar las alarmas automáticamente cuando las mediciones estén fuera de los umbrales esperados. Le recomendamos que utilice las alarmas no solo para las notificaciones, sino también para iniciar acciones automatizadas en respuesta a los eventos detectados. Por ejemplo, puede automatizar un aumento del número de personas HSMs en el clúster.

  • El pilar de la confiabilidad define la supervisión y las alertas como fundamentales para garantizar que cumpla con sus requisitos de disponibilidad. Su solución de monitorización debe poder detectar los fallos de forma eficaz. Cuando detecta problemas o fallos, su objetivo principal es alertar sobre esos problemas. La implementación de prácticas continuas de observabilidad y monitoreo es imprescindible para las arquitecturas resilientes en la nube. Para mejorar sus cargas de trabajo, debe poder medirlas y comprender su estado y estado. Los principios de diseño para la recuperación automática en caso de fallo, la escalabilidad horizontal y el aprovisionamiento de capacidad dependen de la precisión de los servicios de supervisión y alerta.

  • El pilar de seguridad analiza la detección y la prevención de cambios de configuración inesperados o no deseados y de comportamientos inesperados. De forma predeterminada, AWS CloudHSM recopila los registros de auditoría de HSM y los envía a Amazon CloudWatch Logs en tu nombre. Puede utilizar los registros de auditoría para supervisar las operaciones que se realizan en cada HSM del clúster.