REL06-BP06 Realizar revisiones con regularidad - AWS Marco Well-Architected

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

REL06-BP06 Realizar revisiones con regularidad

Revise frecuentemente cómo está implementada la supervisión de cargas de trabajo y actualícela en función de eventos y cambios importantes.

La supervisión efectiva depende de las métricas comerciales clave. Asegúrese de que estas métricas tengan cabida en su carga de trabajo a medida que cambien las prioridades empresariales.

La auditoría de su supervisión le permite asegurarse de que sabrá cuándo cumple una aplicación con sus objetivos de disponibilidad. El análisis de las causas raíces requiere la capacidad de descubrir qué ha ocurrido cuando se produce un error. AWS facilita servicios que le permiten hacer un seguimiento del estado de sus servicios durante un incidente:

  • Amazon CloudWatch Logs: puedes almacenar tus registros en este servicio e inspeccionar su contenido.

  • Amazon CloudWatch Logs Insights: es un servicio totalmente gestionado que le permite analizar registros masivos en cuestión de segundos. Le ofrece consultas y visualizaciones rápidas e interactivas. 

  • AWS Config: puede ver qué infraestructura de AWS se ha estado utilizando en diferentes momentos.

  • AWS CloudTrail: Puede ver cuáles AWS APIs se invocaron, en qué momento y por qué principio.

En AWS, celebramos una reunión semanal para revisar el desempeño operativo y compartir los aprendizajes entre los equipos. Como hay muchos equipos AWS, creamos The Wheel para elegir al azar una carga de trabajo para revisarla. El establecimiento de una cadencia regular para las revisiones de rendimiento operativo y el intercambio de conocimientos mejorará su capacidad para lograr un mayor rendimiento de sus equipos operativos.

Patrones comunes de uso no recomendados:

  • Recopilar solo métricas predeterminadas.

  • Establecer una estrategia de supervisión y no revisarla nunca.

  • No considerar la supervisión cuando se implementan cambios importantes.

Beneficios de establecer esta práctica recomendada: la revisión periódica de la supervisión le permite anticiparse a los posibles problemas en lugar de reaccionar a las notificaciones cuando se produzca un problema previsto.

Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio

Guía para la implementación

  • Cree varios paneles para la carga de trabajo. Debe tener un panel general que contenga las principales métricas del negocio, así como las métricas técnicas que ha identificado como más relevantes para el estado previsto de la carga de trabajo conforme cambie su uso. También debe tener paneles para los distintos niveles y dependencias de la aplicación que puedan inspeccionarse.

  • Programe y lleve a cabo revisiones periódicas de los paneles de cargas de trabajo. Lleve a cabo una inspección periódica de los paneles. Puede tener diferentes cadencias para el alcance de la inspección.

    • Inspeccione las tendencias en las métricas. Compare los valores de las métricas con los valores históricos para saber si hay tendencias que puedan indicar que algo necesita ser investigado. Algunos ejemplos son un aumento de la latencia, una reducción de la función empresarial principal y un aumento de las respuestas a los errores.

    • Inspeccione valores atípicos o anomalías en las métricas. Los promedios o las medianas pueden ocultar valores atípicos y anomalías. Examine los valores más altos y más bajos durante el periodo de tiempo e investigue las causas de los valores extremos. Mientras elimina estas causas, la relajación de la definición de “extremo” le permitirá seguir mejorando la coherencia del rendimiento de sus cargas de trabajo.

    • Busque cambios bruscos en el comportamiento. Un cambio inmediato en la cantidad o en la dirección de una métrica podría indicar que se ha producido un cambio en la aplicación o factores externos que podrían necesitar la inclusión de métricas adicionales para su seguimiento.

Recursos

Documentos relacionados: