Preguntas frecuentes sobre la configuración de alta disponibilidad - Servicio administrado por Amazon para Prometheus

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Preguntas frecuentes sobre la configuración de alta disponibilidad

¿Debo incluir el valor __replica__ en otra etiqueta para hacer un seguimiento de los puntos de muestra?

En un entorno de alta disponibilidad, Amazon Managed Service para Prometheus garantiza que las muestras de datos no se dupliquen mediante la elección de un líder en el clúster de instancias de Prometheus. Si la réplica líder deja de enviar muestras de datos durante 30 segundos, Amazon Managed Service para Prometheus convierte de forma automática otra instancia de Prometheus en réplica líder e ingiere los datos del nuevo líder, incluidos los datos omitidos. Por lo tanto, la respuesta es no, no se recomienda.  Si lo hace, puede provocar problemas como los siguientes:

  • Al consultar un count en PromQL, es posible que se devuelva un valor superior al esperado durante el periodo de elección de un nuevo líder.

  • El número de active series aumenta durante el periodo de elección de un nuevo líder y alcanza el active series limits. Para obtener más información, consulte Cuotas de AMP.

Parece que Kubernetes tiene su propia etiqueta de clúster y no deduplica mis métricas. ¿Cómo puedo solucionarlo?

En Kubernetes 1.28 apiserver_storage_size_bytes se introdujo una nueva métrica con una etiqueta. cluster Esto puede provocar problemas con la deduplicación en Amazon Managed Service for Prometheus, que depende de la etiqueta. cluster En Kubernetes 1.3, se cambia el nombre de la etiqueta a storage-cluster_id (también se le cambia el nombre en los parches posteriores de la versión 1.28 y la 1.29). Si tu clúster emite esta métrica con la cluster etiqueta, Amazon Managed Service for Prometheus no puede deduplicar la serie temporal asociada. Le recomendamos que actualice su clúster de Kubernetes a la última versión parcheada para evitar este problema. Como alternativa, puedes volver a cluster etiquetar la etiqueta de tu apiserver_storage_size_bytes métrica antes de incorporarla a Amazon Managed Service for Prometheus.

nota

Para obtener más información sobre el cambio a Kubernetes, consulte Cambiar el nombre del clúster de etiquetas a storage_cluster_id para la métrica apiserver_storage_size_bytes del proyecto Kubernetes. GitHub