Búsqueda y análisis de registros CloudWatch - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Búsqueda y análisis de registros CloudWatch

Una vez capturados los registros y las métricas en un formato y una ubicación coherentes, puede buscarlos y analizarlos para ayudar a mejorar la eficiencia operativa, además de identificar los problemas y solucionarlos. Le recomendamos que capture los registros en un formato correcto (por ejemplo, JSON) para facilitar la búsqueda y el análisis de los registros. La mayoría de las cargas de trabajo utilizan una colección deAWS recursos como redes, procesamiento, almacenamiento y bases de datos. Siempre que sea posible, debe analizar colectivamente las métricas y los registros de estos recursos y correlacionarlos para supervisar y gestionar de manera eficaz todas susAWS cargas de trabajo.

CloudWatch proporciona varias funciones para ayudar a analizar los registros y las métricas, como CloudWatch Application Insights para definir y monitorear colectivamente las métricas y los registros de una aplicación en diferentesAWS recursos,CloudWatch la detección de anomalías para detectar anomalías para su métricas e información deCloudWatch registro para buscar y analizar de forma interactiva los datos de registro CloudWatch en.

Supervise y analice las aplicaciones de forma colectiva con CloudWatch Application Insights

Los propietarios de aplicaciones pueden usar Amazon CloudWatch Application Insights para configurar la supervisión y el análisis automáticos de las cargas de trabajo. Esto se puede configurar además del monitoreo estándar a nivel de sistemas configurado para todas las cargas de trabajo de una cuenta. Configurar el monitoreo a través de CloudWatch Application Insights también puede ayudar a los equipos de aplicaciones a alinearse de manera proactiva con las operaciones y reducir el tiempo medio de recuperación (MTTR). CloudWatch Application Insights puede ayudar a reducir el esfuerzo necesario para establecer el registro y la supervisión a nivel de la aplicación. También proporciona un marco basado en componentes que ayuda a los equipos a dividir las responsabilidades de registro y monitoreo.

CloudWatch Application Insights utiliza grupos de recursos para identificar los recursos que deben supervisarse colectivamente como una aplicación. Los recursos compatibles del grupo de recursos se convierten en componentes definidos individualmente de su CloudWatch aplicación Application Insights. Cada componente de la CloudWatch aplicación Application Insights tiene sus propios registros, métricas y alarmas.

Para los registros, usted define el conjunto de patrones de registro que debe usarse para el componente y dentro de su CloudWatch aplicación Application Insights. Un conjunto de patrones de registro es un conjunto de patrones de registro que se buscan en función de expresiones regulares, junto con una gravedad baja, media o alta cuando se detecta el patrón. En el caso de las métricas, elige las métricas que desea supervisar para cada componente de una lista de métricas compatibles y específicas del servicio. Para las alarmas, CloudWatch Application Insights crea y configura automáticamente alarmas estándar o de detección de anomalías para las métricas que se supervisan. CloudWatch Application Insights tiene configuraciones automáticas para las métricas y la captura de registros para las tecnologías descritas en los registros y las métricas compatibles con CloudWatch Application Insights en la CloudWatch documentación. El siguiente diagrama muestra las relaciones entre los componentes de CloudWatch Application Insights y sus configuraciones de registro y monitoreo. Cada componente ha definido sus propios registros y métricas para monitorizarlos mediante CloudWatch registros y métricas.

CloudWatch Application Insights tiene una configuración automática específica para la tecnología para las métricas y la captura de registros.

Las instancias de EC2 supervisadas por CloudWatch Application Insights requieren un Systems Manager, CloudWatch agentes y permisos. Para obtener más información al respecto, consulte Requisitos previos para configurar una CloudWatch aplicación con Application Insights en la CloudWatch documentación. CloudWatch Application Insights utiliza Systems Manager para instalar y actualizar el CloudWatch agente. Las métricas y los registros configurados en CloudWatch Application Insights crean un archivo de configuración del CloudWatch agente que se almacena en un parámetro de Systems Manager con elAmazonCloudWatch-ApplicationInsights-SSMParameter prefijo de cada componente de CloudWatch Application Insights. Esto da como resultado que se agregue un archivo de configuración de agentes independiente CloudWatch al directorio de configuración del CloudWatch agente de la instancia EC2. Se ejecuta un comando de Systems Manager para añadir esta configuración a la configuración activa de la instancia EC2. El uso CloudWatch de Application Insights no afecta a los ajustes de configuración de los CloudWatch agentes existentes. Puede usar CloudWatch Application Insights además de sus propias configuraciones de CloudWatch agentes a nivel de sistema y aplicación. Sin embargo, debe asegurarse de que las configuraciones no se superpongan.

Realizar análisis de CloudWatch registros con Logs Insights

CloudWatch Logs Insights facilita la búsqueda en varios grupos de registros mediante un lenguaje de consulta sencillo. Si los registros de su aplicación están estructurados en formato JSON, CloudWatch Logs Insights descubre automáticamente los campos JSON en sus flujos de registro en varios grupos de registros. Puede usar CloudWatch Logs Insights para analizar los registros de su aplicación y sistema, lo que guarda sus consultas para usarlas en el future. La sintaxis de consulta de CloudWatch Logs Insights admite funciones como la agregación con funciones, por ejemplo, sum (), avg (), count (), min () y max (), que pueden resultar útiles para solucionar problemas de las aplicaciones o analizar el rendimiento.

Si utiliza el formato de métrica incrustada para crear CloudWatch métricas, puede consultar sus registros de formato métrico incrustado para generar métricas únicas mediante las funciones de agregación compatibles. Esto ayuda a reducir los costos de CloudWatch monitoreo al capturar los puntos de datos necesarios para generar métricas específicas según sea necesario, en lugar de capturarlos activamente como métricas personalizadas. Esto es especialmente eficaz para dimensiones con una cardinalidad alta que darían como resultado una gran cantidad de métricas. CloudWatch Container Insights también adopta este enfoque y captura datos de rendimiento detallados, pero solo genera CloudWatch métricas para un subconjunto de estos datos.

Por ejemplo, la siguiente entrada métrica incrustada solo genera un conjunto limitado de CloudWatch métricas a partir de los datos métricos capturados en la declaración de formato métrico incrustado:

{ "AutoScalingGroupName": "eks-e0bab7f4-fa6c-64ba-dbd9-094aee6cf9ba", "CloudWatchMetrics": [ { "Metrics": [ { "Unit": "Count", "Name": "pod_number_of_container_restarts" } ], "Dimensions": [ [ "PodName", "Namespace", "ClusterName" ] ], "Namespace": "ContainerInsights" } ], "ClusterName": "eksdemo", "InstanceId": "i-03b21a16b854aa4ca", "InstanceType": "t3.medium", "Namespace": "amazon-cloudwatch", "NodeName": "ip-172-31-10-211.ec2.internal", "PodName": "cloudwatch-agent", "Sources": [ "cadvisor", "pod", "calculated" ], "Timestamp": "1605111338968", "Type": "Pod", "Version": "0", "pod_cpu_limit": 200, "pod_cpu_request": 200, "pod_cpu_reserved_capacity": 10, "pod_cpu_usage_system": 3.268605094109382, "pod_cpu_usage_total": 8.899539221131045, "pod_cpu_usage_user": 4.160042847048305, "pod_cpu_utilization": 0.44497696105655227, "pod_cpu_utilization_over_pod_limit": 4.4497696105655224, "pod_memory_cache": 4096, "pod_memory_failcnt": 0, "pod_memory_hierarchical_pgfault": 0, "pod_memory_hierarchical_pgmajfault": 0, "pod_memory_limit": 209715200, "pod_memory_mapped_file": 0, "pod_memory_max_usage": 43024384, "pod_memory_pgfault": 0, "pod_memory_pgmajfault": 0, "pod_memory_request": 209715200, "pod_memory_reserved_capacity": 5.148439982463127, "pod_memory_rss": 38481920, "pod_memory_swap": 0, "pod_memory_usage": 42803200, "pod_memory_utilization": 0.6172094650851303, "pod_memory_utilization_over_pod_limit": 11.98828125, "pod_memory_working_set": 25141248, "pod_network_rx_bytes": 3566.4174629544723, "pod_network_rx_dropped": 0, "pod_network_rx_errors": 0, "pod_network_rx_packets": 3.3495665260575094, "pod_network_total_bytes": 4283.442421354973, "pod_network_tx_bytes": 717.0249584005006, "pod_network_tx_dropped": 0, "pod_network_tx_errors": 0, "pod_network_tx_packets": 2.6964010534762948, "pod_number_of_container_restarts": 0, "pod_number_of_containers": 1, "pod_number_of_running_containers": 1, "pod_status": "Running" }

Sin embargo, puede consultar las métricas capturadas para obtener más información. Por ejemplo, puede ejecutar la siguiente consulta para ver los 20 módulos más recientes con errores de página de memoria:

fields @timestamp, @message | filter (pod_memory_pgfault > 0) | sort @timestamp desc | limit 20

Realizar análisis de registros con Amazon OpenSearch Service

CloudWatch se integra con Amazon OpenSearch Service al permitirle transmitir los datos de CloudWatch registro de los grupos de registros a un clúster de Amazon OpenSearch Service de su elección con un filtro de suscripción. Puedes usarlo CloudWatch para la captura y el análisis de registros y métricas principales y, a continuación, aumentarlos con Amazon OpenSearch Service para los siguientes casos de uso:

  • Control detallado del acceso a los datos: Amazon OpenSearch Service te permite limitar el acceso a los datos a nivel de campo y ayuda a anonimizar los datos de los campos según los permisos de los usuarios. Esto es útil si desea soporte para la solución de problemas sin exponer datos confidenciales.

  • Agrega y busca registros en varias cuentas, regiones e infraestructuras: puedes transmitir tus registros de varias cuentas y regiones a un clúster de Amazon OpenSearch Service común. Sus equipos de operaciones centralizadas pueden analizar tendencias y problemas y realizar análisis en todas las cuentas y regiones. La transmisión de CloudWatch registros a Amazon OpenSearch Service también te ayuda a buscar y analizar una aplicación multirregional en una ubicación central.

  • Envíe y enriquezca los registros directamente a Amazon OpenSearch Service mediante ElasticSearch agentes: los componentes de su pila de aplicaciones y tecnologías pueden utilizar sistemas operativos que no sean compatibles con el CloudWatch agente. También puede que desee enriquecer y transformar los datos de registro antes de enviarlos a su solución de registro. Amazon OpenSearch Service admite clientes de Elasticsearch estándar, como los remitentes de datos de la familia Elastic Beats y Logstash, que permiten el enriquecimiento y la transformación de los registros antes de enviar los datos de registro a Amazon OpenSearch Service.

  • La solución de administración de operaciones existente utiliza unaElasticSearch pila Logstash y Kibana (ELK) para el registro y la supervisión. Es posible que ya tenga una inversión significativa en Amazon OpenSearch Service o Elasticsearch de código abierto con muchas cargas de trabajo ya configuradas. Es posible que también tengas paneles operativos que se hayan creado en Kibana y quieras seguir usando.

Si no piensas usar CloudWatch registros, puedes usar agentes, controladores de registros y bibliotecas compatibles con Amazon OpenSearch Service (por ejemplo, Fluent Bit, Fluentd, logstash y Open Distro for ElasticSearch API) para enviar tus registros directamente a Amazon OpenSearch Service y omitirlos CloudWatch. Sin embargo, también debe implementar una solución para capturar los registros generados porAWS los servicios. CloudWatch Los registros son la principal solución de captura de registros para muchosAWS servicios y varios servicios crean automáticamente nuevos grupos de registros en CloudWatch. Por ejemplo, Lambda crea un nuevo grupo de registros para cada función de Lambda. Puedes configurar un filtro de suscripción para que un grupo de registros transmita sus registros a Amazon OpenSearch Service. Puede configurar manualmente un filtro de suscripción para cada grupo de registro individual que desee transmitir a Amazon OpenSearch Service. Como alternativa, puede implementar una solución que suscriba automáticamente nuevos grupos de registros a los ElasticSearch clústeres. Puede transmitir los registros a un ElasticSearch clúster en la misma cuenta o a una cuenta centralizada. La transmisión de registros a un ElasticSearch clúster en la misma cuenta ayuda a los propietarios de las cargas de trabajo a analizar y soportar mejor sus cargas de trabajo.

Debería considerar la posibilidad de configurar un ElasticSearch clúster en una cuenta centralizada o compartida para agregar registros en sus cuentas, regiones y aplicaciones. Por ejemplo,AWS Control Tower configura una cuenta de Log Archive que se utiliza para el registro centralizado. Cuando se crea una nueva cuenta enAWS Control Tower, susAWS CloudTrailAWS Config registros se envían a un bucket de S3 en esta cuenta centralizada. El registro instrumentado porAWS Control Tower es para el registro de configuraciones, cambios y auditorías.

Para establecer una solución centralizada de análisis de registros de aplicaciones con Amazon OpenSearch Service, puede implementar uno o más clústeres de Amazon OpenSearch Service centralizados en su cuenta de registro centralizada y configurar grupos de registros en sus otras cuentas para transmitir los registros al Amazon OpenSearch Service centralizado. clústeres.

Puede crear clústeres OpenSearch de Amazon Service independientes para gestionar diferentes aplicaciones o capas de su arquitectura de nube que podrían distribuirse en sus cuentas. El uso de clústeres de Amazon OpenSearch Service independientes le ayuda a reducir los riesgos de seguridad y disponibilidad, y tener un clúster de Amazon OpenSearch Service común puede facilitar la búsqueda y la relación de datos dentro del mismo clúster.