REL11-BP06 Enviar notificações quando os eventos afetarem a disponibilidade - AWS Well-Architected Framework

REL11-BP06 Enviar notificações quando os eventos afetarem a disponibilidade

As notificações são enviadas após a detecção de eventos significativos, mesmo que o problema causado pelo evento tenha sido resolvido automaticamente.

A correção automatizada permite que a carga de trabalho seja confiável. No entanto, ele também pode obscurecer problemas subjacentes que precisam ser resolvidos. Implemente eventos e monitoramento apropriados para que você possa detectar padrões de problemas, incluindo aqueles abordados pela correção automática, para que você possa resolver problemas de causa raiz. Alarmes do Amazon CloudWatch podem ser acionados com base em falhas que ocorrem. Eles também podem ser acionados com base em ações de correção automatizadas executadas. Alarmes do CloudWatch podem ser configurados para enviar e-mails ou registrar incidentes em sistemas de rastreamento de incidentes de terceiros usando a integração com o Amazon SNS.

Antipadrões comuns:

  • Envio de alarmes sem necessidade de reação.

  • Execução da automação de autorreparação, mas sem notificar que a reparação era necessária.

Benefícios do estabelecimento dessa prática recomendada: As notificações de eventos de recuperação garantem que você não ignore problemas que ocorrem com pouca frequência.

Nível de exposição a riscos quando esta prática recomendada não for estabelecida: Médio

Orientações para a implementação

Recursos

Documentos relacionados: