Bonnes pratiques en matière de surveillance AWS CloudHSM - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Bonnes pratiques en matière de surveillance AWS CloudHSM

Les meilleures pratiques de surveillance peuvent améliorer la sécurité, les performances et la fiabilité de votre AWS CloudHSM cluster. Suivez les meilleures pratiques AWS CloudHSM de surveillance décrites dans la AWS CloudHSM documentation. En outre, voici quelques directives clés qui peuvent vous aider à surveiller efficacement vos AWS CloudHSM ressources :

  • Établissez des bases de référence : définissez des mesures et des seuils de référence pour chaque charge de travail, tels que le nombre de clés de session attendues, de clés de jeton et de sessions ouvertes.

  • Alerte lorsque les résultats de la charge de travail sont menacés : configurez les CloudWatch alarmes Amazon pour déclencher des notifications lorsque les métriques de charge de travail dépassent les seuils établis. Ces alertes doivent vous informer des problèmes opérationnels ou de performance ou des risques de sécurité potentiels, tels qu'une activité malveillante.

  • Passez en revue et révisez les indicateurs — Passez régulièrement en revue les données de surveillance pour évaluer l'efficacité des indicateurs que vous avez établis. Les métriques doivent refléter l'état et les performances de votre AWS CloudHSM cluster. Ajustez les indicateurs en fonction de l'évolution des modèles de charge de travail et des exigences opérationnelles. Cela favorise des capacités de surveillance et d'alerte optimales.

Les recommandations de surveillance et d'alerte présentées AWS CloudHSM dans ce guide suivent les meilleures pratiques des piliers suivants du AWS Well-Architected Framework :

  • Le pilier de l'excellence opérationnelle recommande que votre charge de travail soit conçue pour inclure la télémétrie et la surveillance. AWS CloudHSM fournit les informations nécessaires, telles que les métriques, les journaux, les événements et les traces, pour que vous puissiez comprendre l'état de votre ressource. Pour plus d'informations, consultez la section Surveillance AWS CloudHSM dans la AWS CloudHSM documentation. Lorsque vous opérez AWS CloudHSM, vous devez être en mesure de comprendre l'état du cluster, de détecter les événements opérationnels et de répondre aux événements planifiés et imprévus. AWS fournit des outils de surveillance qui vous aident à déterminer quand les résultats organisationnels et commerciaux peuvent être menacés afin que vous puissiez prendre les mesures appropriées au bon moment.

  • Le pilier de l'efficacité des performances vous recommande de surveiller les performances de vos ressources, telles que les AWS CloudHSM clusters, en collectant, en agrégeant et en traitant les indicateurs liés aux performances en temps quasi réel. Vous pouvez identifier la dégradation des performances et corriger les facteurs. Par exemple, vous pouvez détecter des modules de sécurité matériels (HSMs) dans le cluster qui signalent des erreurs côté serveur. Vous pouvez déclencher des alarmes automatiquement lorsque les mesures dépassent les seuils attendus. Nous vous recommandons d'utiliser les alarmes non seulement pour les notifications, mais également pour lancer des actions automatisées en réponse aux événements détectés. Par exemple, vous pouvez automatiser une augmentation du nombre de HSMs dans le cluster.

  • Le pilier de fiabilité définit la surveillance et les alertes comme essentielles pour garantir que vous répondez à vos exigences de disponibilité. Votre solution de surveillance doit être capable de détecter efficacement les défaillances. Lorsqu'il détecte des problèmes ou des défaillances, son objectif principal est d'alerter sur ces problèmes. La mise en œuvre de pratiques d'observabilité et de surveillance continues est essentielle pour garantir la résilience des architectures dans le cloud. Pour améliorer vos charges de travail, vous devez être en mesure de les mesurer et de comprendre leur état et leur état de santé. Les principes de conception pour la reprise automatique en cas de panne, l'évolutivité horizontale et le provisionnement des capacités dépendent de la précision des services de surveillance et d'alerte.

  • Le pilier de sécurité traite de la détection et de la prévention des modifications de configuration inattendues ou indésirables et des comportements inattendus. Par défaut, AWS CloudHSM collecte vos journaux d'audit HSM et les envoie à Amazon CloudWatch Logs en votre nom. Vous pouvez utiliser les journaux d'audit pour surveiller les opérations effectuées au sein de chaque HSM du cluster.