Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Etapa 3: Inspeccionar, adaptar e iterar
Después de implementar su sistema de observabilidad, le recomendamos que revise, evalúe, aprenda, adapte y mejore continuamente su implementación. Puede utilizar el modelo de madurez de la AWS observabilidad
Implemente revisiones periódicas
La observabilidad es un proceso iterativo. Requiere auditorías y evaluaciones periódicas de los componentes existentes, así como cambios y mejoras para impulsar la mejora continua. Le recomendamos que realice revisiones periódicas para reevaluar los umbrales de alerta SLOs, los cuadros de mando, la granularidad de las métricas, las políticas de retención, las estrategias de muestreo, etc., a fin de garantizar que generen valor para sus equipos y su empresa. Al conectar los costos de observabilidad con equipos y servicios específicos, puede tomar decisiones basadas en datos sobre la cobertura y la asignación de recursos.
En Amazon, realizamos revisiones semanales de la preparación operativa (ORRs) para auditar los procesos y las posturas de observabilidad de los equipos comparándolos con las mejores prácticas. Se trata de un ejercicio sin bloqueo que se ajusta a la cantidad de servicios y la frecuencia de los lanzamientos en Amazon.
Según el tamaño de su organización, también puede tener una lista de tareas habituales (BAU), en la que un miembro de cada equipo sea responsable de informar sobre las anomalías y las tendencias, descubrir incógnitas desconocidas, eliminar la instrumentación y las alertas no deseadas, mejorar los paneles y garantizar que la solución de observabilidad siga funcionando para el equipo y esté alineada con los objetivos y las métricas de éxito del equipo. Esta también podría ser una oportunidad para reevaluar la estrategia de alertas para que sea más receptiva, proactiva y esté más cerca del usuario. El objetivo de estas revisiones es crear un círculo virtuoso, como se muestra en la siguiente ilustración, y mejorar la madurez de la postura de observabilidad, tal como se describe en el modelo de madurez de la AWS observabilidad.
Identifique los manuales de estrategias a los que se accede con más frecuencia y considere la posibilidad de mejorar su aplicación o añadir más instrumentación. Identifique los manuales de ejecución que se ejecutan con más frecuencia y considere la posibilidad de automatizarlos.
Los aprendizajes de estas revisiones también se comparten con el equipo de observabilidad y los especialistas, a fin de destacar las mejoras en los programas centrales y en la plataforma de observabilidad. Por ejemplo, en función de la frecuencia de los eventos desencadenados por la implementación, puede decidir priorizar la mejora del proceso de implementación por encima de otros componentes. Si el MTTR es más alto debido a deficiencias en la supervisión, puede priorizar la mejora de la plataforma de observabilidad y su configuración.
Celebre las victorias
Comparta historias de éxito de equipos que utilizan herramientas de observabilidad. Por ejemplo, destaque el éxito de un equipo que utilizó métricas de observabilidad para implementar una solución alternativa que sea más eficiente y reduzca la latencia o el costo. Comunicar este éxito subraya la importancia de la observabilidad y motiva a otros equipos a mejorar su postura de observabilidad y a esforzarse por lograr un éxito similar.
Aprenda de los incidentes
Realice ejercicios irreprochables después de un incidente similares al proceso de corrección de errores (COE)