OPS08-BP04 Crear alertas procesables
Es crucial detectar y responder rápidamente a las desviaciones en el comportamiento de su aplicación. Es especialmente vital reconocer cuándo están en peligro los resultados basados en los indicadores clave de rendimiento (KPI) o cuándo surgen anomalías inesperadas. Basar las alertas en los KPI garantiza que las señales que reciba estén directamente relacionadas con el impacto empresarial u operativo. Este enfoque de alertas procesables promueve respuestas proactivas y ayuda a mantener el rendimiento y la fiabilidad del sistema.
Resultado deseado: recibe alertas oportunas, pertinentes y procesables para identificar y mitigar rápidamente los posibles problemas, especialmente cuando los resultados de los KPI están en peligro.
Patrones comunes de uso no recomendados:
-
Configurar demasiadas alertas que no son cruciales, lo que provoca un exceso de alertas.
-
No se da prioridad a las alertas en función de los KPI, lo que dificulta la comprensión del impacto empresarial de los problemas.
-
Si no se abordan las causas raíz, se generan alertas repetitivas sobre el mismo problema.
Beneficios de establecer esta práctica recomendada:
-
Se reduce el exceso de alertas al poner el foco en las alertas pertinentes y procesables.
-
Mejora del tiempo de actividad y la fiabilidad del sistema gracias a la detección y mitigación proactivas de problemas.
-
Mejora de la colaboración en equipo y resolución de problemas más rápida mediante la integración con herramientas de alerta y comunicación populares.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: Alto
Guía para la implementación
Para crear un mecanismo de alerta eficaz, es fundamental utilizar métricas, registros y datos de rastreo que indiquen cuándo los resultados basados en los KPI están en peligro o se detectan anomalías.
Pasos para la implementación
-
Defina los indicadores clave de rendimiento (KPI). Identifique los KPI de su aplicación. Las alertas deben estar vinculadas a estos KPI para reflejar el impacto empresarial con precisión.
-
Implemente la detección de anomalías:
-
Utilice AWS Cost Anomaly Detection: Configure AWS Cost Anomaly Detection para detectar automáticamente patrones inusuales, lo que garantiza que las alertas solo se generen en caso de auténticas anomalías.
-
Utilice X-Ray Insights:
-
Configure X-Ray Insights para que detecte anomalías en los datos de rastreo.
-
Configure notificaciones para X-Ray Insights para recibir alertas sobre los problemas detectados.
-
-
Integre con DevOps Guru:
-
Utilice Amazon DevOps Guru
por sus capacidades de machine learning para detectar anomalías operativas con los datos existentes. -
Navegue hasta la configuración de notificaciones en DevOps Guru para configurar alertas de anomalías.
-
-
-
Implemente alertas procesables: diseñe alertas que proporcionen la información adecuada para tomar medidas de inmediato.
-
Reduzca el exceso de alarmas: minimice las alertas que no son cruciales. Abrumar a los equipos con numerosas alertas insignificantes puede llevar a que se acaben pasando por algo problemas críticos y a una reducción de la eficacia general del mecanismo de alerta.
-
Configure alarmas compuestas: Utilice alarmas compuestas de Amazon CloudWatch
para consolidar varias alarmas. -
Realice integraciones con herramientas de alerta: incorpore herramientas como Ops Genie
y PagerDuty . -
Utilice Amazon Q Developer in chat applications Integrar Amazon Q Developer in chat applications
para transmitir alertas a Chime, Microsoft Teams y Slack. -
Alerta basada en registros: Utilice los filtros de métricas de registro en CloudWatch para crear alarmas basadas en eventos de registro concretos.
-
Revise e itere: revise y perfeccione periódicamente las configuraciones de las alertas.
Nivel de esfuerzo para el plan de implementación: Medio.
Recursos
Prácticas recomendadas relacionadas:
Documentos relacionados:
Vídeos relacionados:
Ejemplos relacionados: