As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Monitoramento AWS CloudHSM usando métricas, registros de auditoria e alarmes
Shubhansu Sawaria, Amazon Web Services ()AWS
Fevereiro de 2025 (histórico do documento)
Este guia descreve as ferramentas de observabilidade e monitoramento e as melhores práticas para gerenciar um AWS CloudHSMcluster. Para monitorar um AWS CloudHSM cluster, você mede, rastreia e avalia sua disponibilidade, desempenho, segurança e funcionalidade.
Ativado AWS, você pode analisar registros, métricas, eventos e rastreamentos da carga de trabalho para entender a integridade da carga de trabalho. Isso ajuda você a obter insights operacionais ao longo do tempo. O monitoramento ajuda a garantir que os recursos funcionem conforme o esperado para que você possa detectar e resolver problemas de forma proativa. Use métricas, registros e eventos monitorados para definir alarmes quando os limites forem excedidos.
Público-alvo
Este guia é destinado a arquitetos de soluções, DevOps engenheiros seniores e membros da equipe que projetam, implementam ou gerenciam soluções de monitoramento e observabilidade para AWS CloudHSM cargas de trabalho.
Resultados de negócios desejados
Ao implementar as melhores práticas de monitoramento e alerta, você pode ajudar a obter uma infraestrutura de alto desempenho, resiliente, eficiente, segura e econômica para seus aplicativos e cargas de trabalho. Essas melhores práticas permitem observação e análise quase em tempo real da integridade geral e do desempenho do seu AWS CloudHSM cluster.
O monitoramento e os alertas ajudam a evitar a degradação ou interrupção dos serviços de TI associados. No caso de degradação não planejada ou interrupção do serviço, as ferramentas de monitoramento e alerta podem facilitar a detecção, escalonamento, reação, investigação e resolução oportunas.
Uma solução robusta de monitoramento e alerta contribui para os seguintes resultados comerciais principais:
-
Aprimorando a experiência do cliente
-
Construindo a confiança do cliente
-
Mitigação de perdas financeiras associadas a interrupções de serviço não planejadas
-
Aumentar a produtividade dos desenvolvedores ajudando-os a identificar e resolver problemas mais rapidamente
-
Aumentar a eficácia e a eficiência operacionais aumentando a disponibilidade