Antworten auf häufig gestellte Fragen zur Hochverfügbarkeitskonfiguration in Amazon Managed Service for Prometheus - Amazon Managed Service für Prometheus

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Antworten auf häufig gestellte Fragen zur Hochverfügbarkeitskonfiguration in Amazon Managed Service for Prometheus

Sollte ich den Wert __replica__ in ein anderes Label aufnehmen, um die Probenpunkte nachzuverfolgen?

In einer Hochverfügbarkeitsumgebung stellt Amazon Managed Service für Prometheus sicher, dass Datenbeispiele nicht dupliziert werden, indem ein führender Anbieter im Cluster von Prometheus-Instances ausgewählt wird. Wenn das Leader-Replikat 30 Sekunden lang keine Datenbeispiele mehr sendet, macht Amazon Managed Service für Prometheus automatisch eine andere Prometheus-Instance zu einem Leader-Replikat und erfasst Daten vom neuen Leader-Replikat, einschließlich aller fehlenden Daten. Daher lautet die Antwort nein, es wird nicht empfohlen.  Dies kann zu folgenden Problemen führen:

  • Die Abfrage von count in PromQL kann während der Zeit der Wahl eines neuen Leaders zu einem höheren Wert als erwartet führen.

  • Die Anzahl von active series wird während der Wahl eines neuen Leaders erhöht und erreicht active series limits. Weitere Informationen finden Sie unter AMPKontingente.

Kubernetes scheint ein eigenes Cluster-Label zu haben und dedupliziert meine Metriken nicht. Wie lässt sich dieses Problem beheben?

In Kubernetes 1.28 apiserver_storage_size_bytes wurde eine neue Metrik mit einem Label eingeführt. cluster Dies kann zu Problemen mit der Deduplizierung in Amazon Managed Service for Prometheus führen, die vom Label abhängen. cluster In Kubernetes 1.3 wurde das Label umbenannt in storage-cluster_id (es wurde auch in späteren Patches von 1.28 und 1.29 umbenannt). Wenn Ihr Cluster diese Metrik mit dem cluster Label ausgibt, kann Amazon Managed Service for Prometheus die zugehörige Zeitreihe nicht deduplizieren. Wir empfehlen Ihnen, Ihren Kubernetes-Cluster auf die neueste gepatchte Version zu aktualisieren, um dieses Problem zu vermeiden. Alternativ können Sie das cluster Etikett auf Ihrer apiserver_storage_size_bytes Metrik neu etikettieren, bevor Sie sie in Amazon Managed Service for Prometheus aufnehmen.

Anmerkung

Weitere Informationen zur Umstellung auf Kubernetes finden Sie im Kubernetes-Projekt unter Label-Cluster in storage_cluster_id für die Metrik apiserver_storage_size_bytes umbenennen. GitHub