PERF05-BP05 Utilizar la automatización para solucionar de forma proactiva los problemas relacionados con el rendimiento - Pilar de eficiencia del rendimiento

PERF05-BP05 Utilizar la automatización para solucionar de forma proactiva los problemas relacionados con el rendimiento

Utilice los indicadores clave de rendimiento (KPI), junto con los sistemas de supervisión y alerta, para abordar de manera proactiva los problemas relacionados con el rendimiento.

Antipatrones usuales:

  • Únicamente permite que el personal de operaciones pueda llevar a cabo cambios operativos en la carga de trabajo.

  • Permite que todas las alarmas se filtren al equipo de operaciones sin medidas de corrección proactivas.

Ventajas de aplicar esta práctica recomendada: al solucionar de forma proactiva las acciones de alarma, al personal de soporte podrá concentrarse en aquellos elementos que no pueden abordarse de forma automática. De este modo, el personal de operaciones podrá gestionar todas las alarmas sin sentirse abrumado y concentrarse exclusivamente en las alarmas críticas.

Nivel de riesgo expuesto si no se establece esta práctica recomendada: bajo

Guía para la implementación

Usa alarmas para activar acciones automatizadas y corregir los problemas siempre que sea posible. Escala la alarma a aquellos capaces de responder cuando no se pueda recurrir a la respuesta automatizada. Por ejemplo, podría tener un sistema capaz de predecir los valores esperados de los indicadores clave de rendimiento (KPI) y emitir alarmas cuando se sobrepasen ciertos umbrales, o una herramienta que pudiera detener o revertir automáticamente los despliegues si los KPI están fuera de los valores esperados.

Implementar procesos que proporcionen visibilidad del rendimiento a medida que ejecuta la carga de trabajo. Cree paneles de supervisión y establezca normas de referencia sobre las expectativas del rendimiento para determinar si la carga de trabajo funciona de manera óptima.

Pasos para la implementación

  • Identifique y estudie si el problema de rendimiento puede solucionarse automáticamente. Use soluciones de supervisión de AWS, como Amazon CloudWatch o AWS X-Ray, que le ayuden a comprender mejor la causa principal del problema.

  • Cree un plan y un proceso de corrección paso a paso que pueda utilizar para solucionar el problema automáticamente.

  • Configure el activador que va a iniciar automáticamente el proceso de corrección. Por ejemplo, puede definir un activador que reinicie automáticamente una instancia cuando se alcance un determinado umbral de uso de la CPU.

  • Utilice los servicios y las tecnologías de AWS para automatizar el proceso de corrección. Por ejemplo, la Automatización de AWS Systems Manager proporciona un mecanismo seguro y escalable para automatizar el proceso de corrección.

  • Pruebe el proceso de corrección automatizado en un entorno de preproducción.

  • Una vez realizadas las pruebas, implemente el proceso de corrección en el entorno de producción y supervíselo continuamente para identificar posibles áreas de mejora.

Recursos

Documentos relacionados:

Vídeos relacionados:

Ejemplos relacionados: