OPS08-BP04 Crear alertas procesables - AWS Well-Architected Framework

OPS08-BP04 Crear alertas procesables

Es crucial detectar y responder rápidamente a las desviaciones en el comportamiento de su aplicación. Es especialmente vital reconocer cuándo están en peligro los resultados basados en los indicadores clave de rendimiento (KPI) o cuándo surgen anomalías inesperadas. Basar las alertas en los KPI garantiza que las señales que reciba estén directamente relacionadas con el impacto empresarial u operativo. Este enfoque de alertas procesables promueve respuestas proactivas y ayuda a mantener el rendimiento y la fiabilidad del sistema.

Resultado deseado: recibe alertas oportunas, pertinentes y procesables para identificar y mitigar rápidamente los posibles problemas, especialmente cuando los resultados de los KPI están en peligro.

Patrones comunes de uso no recomendados:

  • Configurar demasiadas alertas que no son cruciales, lo que provoca un exceso de alertas.

  • No se da prioridad a las alertas en función de los KPI, lo que dificulta la comprensión del impacto empresarial de los problemas.

  • Si no se abordan las causas raíz, se generan alertas repetitivas sobre el mismo problema.

Beneficios de establecer esta práctica recomendada:

  • Se reduce el exceso de alertas al poner el foco en las alertas pertinentes y procesables.

  • Mejora del tiempo de actividad y la fiabilidad del sistema gracias a la detección y mitigación proactivas de problemas.

  • Mejora de la colaboración en equipo y resolución de problemas más rápida mediante la integración con herramientas de alerta y comunicación populares.

Nivel de riesgo expuesto si no se establece esta práctica recomendada: Alto

Guía para la implementación

Para crear un mecanismo de alerta eficaz, es fundamental utilizar métricas, registros y datos de rastreo que indiquen cuándo los resultados basados en los KPI están en peligro o se detectan anomalías.

Pasos para la implementación

  1. Defina los indicadores clave de rendimiento (KPI). Identifique los KPI de su aplicación. Las alertas deben estar vinculadas a estos KPI para reflejar el impacto empresarial con precisión.

  2. Implemente la detección de anomalías:

    • Utilice AWS Cost Anomaly Detection: Configure AWS Cost Anomaly Detection para detectar automáticamente patrones inusuales, lo que garantiza que las alertas solo se generen en caso de auténticas anomalías.

    • Utilice X-Ray Insights:

      1. Configure X-Ray Insights para que detecte anomalías en los datos de rastreo.

      2. Configure notificaciones para X-Ray Insights para recibir alertas sobre los problemas detectados.

    • Integre con DevOps Guru:

      1. Utilice Amazon DevOps Guru por sus capacidades de machine learning para detectar anomalías operativas con los datos existentes.

      2. Navegue hasta la configuración de notificaciones en DevOps Guru para configurar alertas de anomalías.

  3. Implemente alertas procesables: diseñe alertas que proporcionen la información adecuada para tomar medidas de inmediato.

  4. Reduzca el exceso de alarmas: minimice las alertas que no son cruciales. Abrumar a los equipos con numerosas alertas insignificantes puede llevar a que se acaben pasando por algo problemas críticos y a una reducción de la eficacia general del mecanismo de alerta.

  5. Configure alarmas compuestas: Utilice alarmas compuestas de Amazon CloudWatch para consolidar varias alarmas.

  6. Realice integraciones con herramientas de alerta: incorpore herramientas como Ops Genie y PagerDuty.

  7. Utilice Amazon Q Developer in chat applications Integrar Amazon Q Developer in chat applicationspara transmitir alertas a Chime, Microsoft Teams y Slack.

  8. Alerta basada en registros: Utilice los filtros de métricas de registro en CloudWatch para crear alarmas basadas en eventos de registro concretos.

  9. Revise e itere: revise y perfeccione periódicamente las configuraciones de las alertas.

Nivel de esfuerzo para el plan de implementación: Medio.

Recursos

Prácticas recomendadas relacionadas:

Documentos relacionados:

Vídeos relacionados:

Ejemplos relacionados: