OPS10-BP07 Automatizar las respuestas a eventos
La automatización de las respuestas a eventos es clave para una gestión operativa rápida, coherente y sin errores. Cree procesos simplificados y utilice herramientas para administrar y responder automáticamente a los eventos, minimizando las intervenciones manuales y mejorando la eficacia operativa.
Resultado deseado:
-
Reducción de los errores humanos y tiempos de resolución más rápidos mediante la automatización.
-
Gestión de eventos operativos coherente y fiable.
-
Mejora de la eficiencia operativa y la fiabilidad del sistema.
Patrones comunes de uso no recomendados:
-
La gestión manual de eventos provoca retrasos y errores.
-
La automatización se pasa por alto en las tareas críticas y repetitivas.
-
Las tareas manuales y repetitivas provocan saturación de alertas y la omisión de problemas críticos.
Beneficios de establecer esta práctica recomendada:
-
Respuestas rápidas a los eventos, lo que reduce el tiempo de inactividad del sistema.
-
Operaciones fiables con una gestión de eventos automatizada y coherente.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: Medio
Guía para la implementación
Incorpore la automatización para crear flujos de trabajo operativos eficientes y minimizar las intervenciones manuales.
Pasos para la implementación
-
Identifique las oportunidades de automatización: Determine qué tareas repetitivas pueden automatizarse, como la resolución de problemas, el enriquecimiento de tiques, la administración de la capacidad, el escalamiento, los despliegues y las pruebas.
-
Identifique los avisos de automatización:
-
Evalúe y defina las condiciones o métricas específicas que inician las respuestas automatizadas mediante acciones de alarma de Amazon CloudWatch.
-
Utilice Amazon EventBridge
para responder a eventos en servicios de AWS, cargas de trabajo personalizadas y aplicaciones SaaS. -
Considere eventos de iniciación como entradas de registro específicas, umbrales de métricas de rendimientoo cambios de estado en recursos de AWS.
-
-
Implemente la automatización basada en eventos:
-
Utilice los runbooks de automatización de AWS Systems Manager para simplificar las tareas de mantenimiento, despliegue y corrección.
-
La creación de incidentes en Incident Manager recopila y agrega automáticamente detalles sobre los recursos de AWS involucrados en el incidente.
-
Monitorice proactivamente las cuotas mediante Monitor de cuotas para AWS AWS
. -
Ajuste automáticamente la capacidad con AWS Auto Scaling
para mantener la disponibilidad y el rendimiento. -
Automatice los procesos de desarrollo con Amazon CodeCatalyst
. -
Realice pruebas de humo o monitorice continuamente los puntos de enlace y las API con la monitorización sintética.
-
-
Mitigue los riesgos mediante la automatización:
-
Implemente respuestas de seguridad automatizadas
para abordar rápidamente los riesgos. -
Utilice AWS Systems Manager State Manager para reducir el cambio de configuración.
-
Nivel de esfuerzo para el plan de implementación: Alto
Recursos
Prácticas recomendadas relacionadas:
Documentos relacionados:
Vídeos relacionados:
Ejemplos relacionados: