Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Supervise los recolectores con troncos vendidos
Amazon Managed Service para los coleccionistas de Prometheus proporciona registros vendidos para ayudarte a supervisar y solucionar los problemas del proceso de recopilación de métricas. Estos registros se envían automáticamente a Amazon CloudWatch Logs y proporcionan visibilidad de las operaciones de descubrimiento de servicios, recopilación de métricas y exportación de datos. El recopilador vende los registros de los tres componentes principales del proceso de recopilación de métricas:
Temas
Registros de descubrimiento de servicios
Los registros de descubrimiento de servicios proporcionan información sobre el proceso de descubrimiento de objetivos, que incluye:
-
Problemas de autenticación o permisos al acceder a los recursos de la API de Kubernetes.
-
Errores de configuración en los ajustes de detección de servicios.
Los siguientes ejemplos muestran los errores comunes de autenticación y permisos que se pueden encontrar durante la detección de servicios:
- Clúster Amazon EKS inexistente
-
Cuando el clúster de Amazon EKS especificado no existe, aparece el siguiente error:
{ "component": "SERVICE_DISCOVERY", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "log": "Failed to watch Service - Verify your scraper source exists." }, "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
- Permisos de servicios no válidos
-
Cuando el recopilador carece de los permisos de control de acceso basado en roles (RBAC) adecuados para ver los servicios, aparece el siguiente error:
{ "component": "SERVICE_DISCOVERY", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "log": "Failed to watch Service - Verify your scraper source permissions are valid." }, "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
- Permisos no válidos para los puntos finales
-
Cuando el recopilador carece de los permisos de control de acceso basado en roles (RBAC) adecuados para vigilar los puntos finales, aparece el siguiente error:
{ "component": "SERVICE_DISCOVERY", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "log": "Failed to watch Endpoints - Verify your scraper source permissions are valid." }, "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
Registros del recopilador
Los registros recopiladores proporcionan información sobre el proceso de extracción de métricas, que incluye:
-
Los errores de raspado se deben a que los puntos finales no están disponibles.
-
Problemas de conexión al intentar localizar objetivos.
-
Se agotan los tiempos de espera durante las operaciones de raspado.
-
Errores de estado HTTP devueltos por los objetivos de raspado.
Los siguientes ejemplos muestran los errores de recopilación más comunes que se pueden encontrar durante el proceso de extracción de métricas:
- Falta el punto final de las métricas
-
Cuando el
/metrics
punto final no está disponible en la instancia de destino, aparece este error:{ "component": "COLLECTOR", "message": { "log": "Failed to scrape Prometheus endpoint - verify /metrics endpoint is available", "job": "pod_exporter", "targetLabels": "{__name__=\"up\", instance=\10.24.34.0\", job=\"pod_exporter\"}" }, "timestamp": "1752787969551", "scraperId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
- Conexión rechazada
-
Cuando el recopilador no puede establecer una conexión con el punto final de destino, aparece este error:
{ "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "message": "Scrape failed", "scrape_pool": "pod_exporter", "target": "http://10.24.34.0:80/metrics", "error": "Get \"http://10.24.34.0:80/metrics\": dial tcp 10.24.34.0:80: connect: connection refused" }, "component": "COLLECTOR" }
Registros del exportador
Los registros de los exportadores proporcionan información sobre el proceso de envío de las métricas recopiladas a tu espacio de trabajo de Amazon Managed Service for Prometheus, que incluye:
-
Número de métricas y puntos de datos procesados.
-
Fallos de exportación debido a problemas con el espacio de trabajo.
-
Errores de permisos al intentar escribir métricas.
-
Fallos de dependencia en el proceso de exportación.
El siguiente ejemplo muestra un error de exportación común que puede producirse durante el proceso de exportación de métricas:
- No se encontró el espacio de trabajo
-
Si no se encuentra el espacio de trabajo de destino para la exportación de métricas, aparece este error:
{ "component": "EXPORTER", "message": { "log": "Failed to export to the target workspace - Verify your scraper destination.", "samplesDropped": 5 }, "timestamp": "1752787969664", "scraperId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
Descripción y uso de los registros vendidos por el recopilador
Estructura de registros
Todos los registros vendidos por el recopilador siguen una estructura coherente con los siguientes campos:
- scrapeConfigId
-
El identificador único de la configuración de raspado que generó el registro.
- timestamp
-
La hora en que se generó la entrada del registro.
- message
-
El contenido del mensaje de registro, que puede incluir campos estructurados adicionales.
- componente
-
El componente que generó el registro (SERVICE_DISCOVERY, COLLECTOR o EXPORTER)
Uso de registros vendidos para solucionar problemas
Los registros vendidos del recopilador le ayudan a solucionar problemas comunes relacionados con la recopilación de métricas:
-
Problemas de descubrimiento de servicios
-
Compruebe los registros de SERVICE_DISCOVERY para ver si hay errores de autenticación o permiso.
-
Compruebe que el recopilador tenga los permisos necesarios para acceder a los recursos de Kubernetes.
-
-
Problemas de extracción de métricas
-
Compruebe los registros de COLLECTOR para ver si hay errores de raspado.
-
Compruebe que los puntos finales de destino sean accesibles y que devuelvan las métricas.
-
Asegúrese de que las reglas del firewall permitan al recopilador conectarse a los puntos finales de destino.
-
-
Problemas de exportación de métricas
-
Compruebe los registros de EXPORTER para ver si hay errores de exportación.
-
Compruebe que el espacio de trabajo existe y está configurado correctamente.
-
Asegúrese de que el recopilador tenga los permisos necesarios para escribir en el espacio de trabajo.
-
Acceder a los registros vendidos por el recopilador
Los registros vendidos por Collector se envían automáticamente a Amazon CloudWatch Logs. Para acceder a estos registros:
-
Abra la CloudWatch consola en https://console.aws.amazon.com/cloudwatch/
. -
En el panel de navegación, seleccione Grupos de registro.
-
Busque y seleccione el grupo de registros para su recopilador:
/aws/prometheus/workspace_id/collector/collector_id
. -
Examine o busque en el registro de eventos para encontrar información relevante.
También puedes usar CloudWatch Logs Insights para consultar y analizar los registros de tu recopilador. Por ejemplo, para buscar todos los errores de detección de servicios:
fields @timestamp, message.message | filter component = "SERVICE_DISCOVERY" and message.message like /Failed/ | sort @timestamp desc
Mejores prácticas para monitorear los recopiladores
Para supervisar eficazmente tu Amazon Managed Service para coleccionistas de Prometheus:
-
Configure CloudWatch alarmas en caso de problemas críticos con los colectores, como fallos de raspado persistentes o errores de exportación. Para obtener más información, consulta Alarmas en la Guía del CloudWatch usuario de Amazon.
-
Cree CloudWatch paneles para visualizar las métricas de rendimiento de los recopiladores junto con los datos de registro vendidos. Para obtener más información, consulta Dashboards en la Guía del CloudWatch usuario de Amazon.
-
Revise periódicamente los registros de detección de servicios para asegurarse de que los objetivos se descubran correctamente.
-
Supervise la cantidad de objetivos descartados para identificar posibles problemas de configuración.
-
Realice un seguimiento de los errores de exportación para garantizar que las métricas se envíen correctamente a su espacio de trabajo.