Monitoramento AWS CloudHSM usando métricas, registros de auditoria e alarmes - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Monitoramento AWS CloudHSM usando métricas, registros de auditoria e alarmes

Shubhansu Sawaria, Amazon Web Services ()AWS

Fevereiro de 2025 (histórico do documento)

Este guia descreve as ferramentas de observabilidade e monitoramento e as melhores práticas para gerenciar um AWS CloudHSMcluster. Para monitorar um AWS CloudHSM cluster, você mede, rastreia e avalia sua disponibilidade, desempenho, segurança e funcionalidade.

Ativado AWS, você pode analisar registros, métricas, eventos e rastreamentos da carga de trabalho para entender a integridade da carga de trabalho. Isso ajuda você a obter insights operacionais ao longo do tempo. O monitoramento ajuda a garantir que os recursos funcionem conforme o esperado para que você possa detectar e resolver problemas de forma proativa. Use métricas, registros e eventos monitorados para definir alarmes quando os limites forem excedidos.

Público-alvo

Este guia é destinado a arquitetos de soluções, DevOps engenheiros seniores e membros da equipe que projetam, implementam ou gerenciam soluções de monitoramento e observabilidade para AWS CloudHSM cargas de trabalho.

Resultados de negócios desejados

Ao implementar as melhores práticas de monitoramento e alerta, você pode ajudar a obter uma infraestrutura de alto desempenho, resiliente, eficiente, segura e econômica para seus aplicativos e cargas de trabalho. Essas melhores práticas permitem observação e análise quase em tempo real da integridade geral e do desempenho do seu AWS CloudHSM cluster.

O monitoramento e os alertas ajudam a evitar a degradação ou interrupção dos serviços de TI associados. No caso de degradação não planejada ou interrupção do serviço, as ferramentas de monitoramento e alerta podem facilitar a detecção, escalonamento, reação, investigação e resolução oportunas.

Uma solução robusta de monitoramento e alerta contribui para os seguintes resultados comerciais principais:

  • Aprimorando a experiência do cliente

  • Construindo a confiança do cliente

  • Mitigação de perdas financeiras associadas a interrupções de serviço não planejadas

  • Aumentar a produtividade dos desenvolvedores ajudando-os a identificar e resolver problemas mais rapidamente

  • Aumentar a eficácia e a eficiência operacionais aumentando a disponibilidade