Réponses aux questions les plus fréquemment posées sur la configuration de haute disponibilité dans Amazon Managed Service for Prometheus - Amazon Managed Service for Prometheus

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Réponses aux questions les plus fréquemment posées sur la configuration de haute disponibilité dans Amazon Managed Service for Prometheus

Dois-je inclure la valeur __replica__ dans une autre étiquette pour suivre les points de prélèvement ?

Dans un environnement haute disponibilité, Amazon Managed Service for Prometheus garantit que les échantillons de données ne sont pas dupliqués en élisant un leader dans le cluster d’instances Prometheus. Si la réplique leader cesse d’envoyer des échantillons de données pendant 30 secondes, Amazon Managed Service for Prometheus transforme automatiquement une autre instance de Prometheus en réplique leader et ingère les données du nouveau leader, y compris les données manquantes. Par conséquent, la réponse est non, ce n’est pas recommandé.  Cela peut entraîner des problèmes tels que les suivants :

  • L’interrogation d’un count dans ProMQL peut renvoyer une valeur supérieure à celle attendue pendant la période d’élection d’un nouveau leader.

  • Le nombre de active series augmente pendant la période d’élection d’un nouveau leader et il atteint les active series limits. Voir AMPQuotas pour plus d'informations.

Kubernetes semble avoir son propre label de cluster et ne déduplique pas mes métriques. Comment corriger ce problème ?

Une nouvelle métrique apiserver_storage_size_bytes a été introduite dans Kubernetes 1.28, avec une étiquette. cluster Cela peut entraîner des problèmes de déduplication dans Amazon Managed Service for Prometheus, qui dépendent de l'étiquette. cluster Dans Kubernetes 1.3, le label est renommé en storage-cluster_id (il est également renommé dans les derniers patchs 1.28 et 1.29). Si votre cluster émet cette métrique avec l'clusterétiquette, Amazon Managed Service for Prometheus ne peut pas dédupliquer la série chronologique associée. Nous vous recommandons de mettre à niveau votre cluster Kubernetes vers la dernière version corrigée pour éviter ce problème. Vous pouvez également cluster réétiqueter l'étiquette de votre apiserver_storage_size_bytes métrique avant de l'intégrer dans Amazon Managed Service for Prometheus.

Note

Pour plus de détails sur la modification apportée à Kubernetes, voir Renommer le cluster d'étiquettes en storage_cluster_id pour la métrique apiserver_storage_size_bytes dans le projet Kubernetes. GitHub