OPS08-BP03 Recopilar y analizar métricas de cargas de trabajo
Lleve a cabo revisiones periódicas y proactivas de las métricas de la carga de trabajo para identificar tendencias y determinar si es necesaria una respuesta y validar la consecución de resultados empresariales. Agregue las métricas de sus aplicaciones y componentes de la carga de trabajo a una ubicación central. Utilice paneles y herramientas de análisis para analizar la telemetría y determinar el estado de la carga de trabajo. Implemente un mecanismo para realizar revisiones periódicas del estado de la carga de trabajo con las partes interesadas en la organización.
Resultado deseado:
-
Las métricas de la carga de trabajo se recopilan en una ubicación central.
-
Se utilizan paneles y herramientas de análisis para analizar las tendencias del estado de la carga de trabajo.
-
Lleva a cabo revisiones periódicas de las métricas de la carga de trabajo con su organización.
Antipatrones usuales:
-
La organización recopila métricas de la carga de trabajo en dos plataformas de observabilidad diferentes. No es capaz de determinar el estado de la carga de trabajo porque las plataformas son incompatibles.
-
Los índices de error de un componente de la carga de trabajo aumenta poco a poco. No se da cuenta de esta tendencia porque su organización no realiza revisiones periódicas de las métricas de la carga de trabajo. Se produce un error en el componente al cabo de una semana, lo que afecta a la carga de trabajo.
Beneficios de establecer esta práctica recomendada:
-
Ha aumentado la concienciación sobre el estado de la carga de trabajo y la consecución de resultados empresariales.
-
Las tendencias del estado de la carga de trabajo pueden desarrollarse a lo largo del tiempo.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: alto
Guía para la implementación
Recopile métricas de la carga de trabajo en una ubicación central. Por medio de paneles y herramientas de análisis, estudie las métricas de la carga de trabajo para obtener información sobre el estado de la carga de trabajo, desarrollar tendencias de estado de la carga de trabajo y validar la consecución de resultados empresariales. Implemente un mecanismo para realizar revisiones periódicas de las métricas de la carga de trabajo.
Ejemplo de cliente
AnyCompany Retail lleva a cabo revisiones de las métricas de carga de trabajo todos los miércoles. Reúne a las partes interesadas de toda la empresa y repasa las métricas de la semana anterior. Durante la reunión, se destacan las tendencias y las ideas extraídas de las herramientas de análisis. Se publican paneles internos con métricas clave de la carga de trabajo que todos los empleados pueden ver y consultar.
Pasos para la implementación
-
Identifique las métricas de la carga de trabajo que están vinculadas al estado de la carga de trabajo. Empezando por los KPI empresariales, identifique las métricas de las aplicaciones, componentes y plataformas que proporcionan una visión general del estado de la carga de trabajo.
-
Puede publicar las métricas personalizadas en Amazon CloudWatch. Puede aprovechar el agente Amazon CloudWatch para recopilar métricas y registros de instancias Amazon EC2 y servidores locales.
-
AWS Distro for OpenTelemetry
permite recopilar métricas de aplicaciones existentes que se pueden utilizar para añadir nuevas métricas. -
Los clientes con Enterprise Support pueden solicitar el taller Building a Monitoring Strategy Workshop
(Creación de una estrategia de supervisión) a su gerente técnico de cuentas. Este taller le ayuda a erigir una estrategia de observabilidad para su carga de trabajo.
-
-
Recopile métricas de la carga de trabajo en una plataforma central. Si las métricas de la carga de trabajo se dividen entre diferentes plataformas, puede resultar difícil analizar y desarrollar tendencias. La plataforma debe disponer de paneles y capacidades analíticas.
-
Amazon CloudWatch puede recopilar y conservar métricas de la carga de trabajo. En las topologías multicuenta, se recomienda disponer de una cuenta central de registro y supervisión, denominada cuenta de archivo de registros.
-
-
Cree un panel consolidado de métricas de la carga de trabajo. Utilice esta vista para hacer revisiones de métricas y analizar tendencias.
-
Puede crear paneles de CloudWatch personalizados para recopilar las métricas de la carga de trabajo en una vista consolidada.
-
-
Implemente un proceso de revisión de las métricas de la carga de trabajo. Con una periodicidad semanal, quincenal o mensual, revise las métricas de la carga de trabajo con las partes interesadas, incluido el personal técnico y no técnico. Utilice estas sesiones de revisión para identificar tendencias y obtener información sobre el estado de la carga de trabajo.
Nivel de esfuerzo para el plan de implementación: alto. Si las métricas de la carga de trabajo no se recopilan de forma centralizada, podría ser necesario efectuar una inversión significativa para consolidarlas en una plataforma.
Recursos
Prácticas recomendadas relacionadas:
-
OPS08-BP01 Identificar los indicadores clave de rendimiento - Antes de seleccionar las métricas de la carga de trabajo debe identificar los indicadores clave de rendimiento.
-
OPS08-BP02 Definir las métricas de las cargas de trabajo - Debe definir las métricas de la carga de trabajo antes de recopilarlas y analizarlas.
Documentos relacionados:
-
Power operational insights with Amazon QuickSight
(Potenciar la información operativa con Amazon QuickSight) -
Using Amazon CloudWatch dashboards custom widgets
(Uso de los widgets personalizados de los paneles de Amazon CloudWatch)
Vídeos relacionados:
-
Create Cross Account & Cross Region CloudWatch Dashboards
(Crear paneles de CloudWatch entre cuentas y regiones) -
Monitor AWS Resources Using Amazon CloudWatch Dashboards
(Supervisión de los recursos de AWS con paneles de Amazon CloudWatch)
Ejemplos relacionados:
-
AWS Management and Governance Tools Workshop - CloudWatch Dashboards
(Taller de herramientas de administración y gobernanza de AWS: paneles de CloudWatch) -
Well-Architected Labs - Level 100: Monitoring with CloudWatch Dashboards
(Laboratorios de Well-Architected - Nivel 100: Supervisión con paneles de CloudWatch)
Servicios relacionados: