Implementierungsleitfaden Implementierungsschritte Ressourcen

REL06-BP07 Überwachen Sie die end-to-end Nachverfolgung von Anfragen durch Ihr System

Verfolgen Sie Anfragen während der Bearbeitung durch die Servicekomponenten, damit Produktteams Probleme einfacher analysieren und beheben und die Leistung verbessern können.

Gewünschtes Ergebnis: Workloads mit umfassender Ablaufverfolgung über alle Komponenten hinweg lassen sich leicht debuggen. Dadurch werden die durchschnittliche Zeit bis zur Behebung (MTTR) von Fehlern und die Latenz verbessert, da die Ursachenerkennung vereinfacht wird. End-to-endDie Ablaufverfolgung reduziert die Zeit, die benötigt wird, um betroffene Komponenten zu erkennen und die Ursachen von Fehlern oder Latenzen detailliert zu ermitteln.

Typische Anti-Muster:

Nachverfolgung wird für einige Komponenten verwendet, aber nicht für alle. Ohne Rückverfolgung für können Teams beispielsweise die Latenz AWS Lambda, die durch Kaltstarts bei einer hohen Arbeitslast verursacht wird, möglicherweise nicht genau nachvollziehen.
Synthetic Canaries oder die Überwachung realer Benutzer (RUM) sind nicht mit Tracing konfiguriert. Ohne Canaries oder RUM wird die Klienteninteraktionstelemetrie bei der Trace-Analyse nicht berücksichtigt, was zu einem unvollständigen Leistungsprofil führt.
Hybride Workloads umfassen sowohl cloudnative Nachverfolgungs-Tools als auch Tools von Drittanbietern, es wurden jedoch keine Schritte unternommen, um eine einzige Nachverfolgungs-Lösung auszuwählen und vollständig zu integrieren. Je nach gewählter Tracing-Lösung SDKs sollte Cloud-natives Tracing zur Instrumentierung von Komponenten verwendet werden, bei denen es sich nicht um Cloud-native Komponenten handelt, oder Tools von Drittanbietern sollten so konfiguriert werden, dass sie Cloud-native Trace-Telemetrie aufnehmen.

Vorteile der Nutzung dieser bewährten Methode: Wenn Entwicklungsteams über Probleme informiert werden, können sie sich ein vollständiges Bild der Interaktionen zwischen den Systemkomponenten machen, einschließlich der Beziehung zwischen Komponenten, Protokollierung, Leistung und Ausfällen. Da die Nachverfolgung die visuelle Identifizierung der Ursachen erleichtert, können diese schneller untersucht werden. Teams, die die Interaktionen der Komponenten im Detail verstehen, treffen bessere und schnellere Entscheidungen bei der Lösung von Problemen. Entscheidungen, z. B. wann ein Notfallwiederherstellung (DR)-Failover eingeleitet werden sollte oder wo Strategien zur Selbstreparatur am besten implementiert werden sollten, können durch die Analyse von Systemprotokollen verbessert werden, was letztlich die Kundenzufriedenheit mit Ihren Services erhöht.

Risikostufe, wenn diese bewährte Methode nicht eingeführt wird: Mittel

Implementierungsleitfaden

Teams, die verteilte Anwendungen betreiben, können mithilfe von Nachverfolgungs-Tools eine Korrelationskennung einrichten, Spuren von Anfragen erfassen und Service-Maps für verbundene Komponenten erstellen. Alle Anwendungskomponenten sollten in den Anforderungsspuren enthalten sein, einschließlich Service-Clients, Middleware-Gateways und Event Busse, Rechenkomponenten und Speicher, einschließlich Schlüssel-Wert-Speicher und -Datenbanken. Integrieren Sie synthetische Kanarien und die Überwachung realer Benutzer in Ihre end-to-end Tracing-Konfiguration, um Kundeninteraktionen und Latenz aus der Ferne zu messen, sodass Sie die Leistung Ihres Systems anhand Ihrer Service Level Agreements und Ziele genau bewerten können.

Sie können die Instrumentierungsservices von Amazon CloudWatch Application Monitoring verwenden AWS X-Ray, um einen vollständigen Überblick über die Anfragen zu erhalten, während sie Ihre Anwendung durchlaufen. X-Ray sammelt Anwendungstelemetrie und ermöglicht es Ihnen, sie nach Payloads, Funktionen, Traces und Diensten zu visualisieren und zu filtern. X-Ray kann für Systemkomponenten mit No-Code oder Low-Code aktiviert werden. APIs CloudWatch Die Anwendungsüberwachung umfasst ServiceLens die Integration Ihrer Traces mit Metriken, Protokollen und Alarmen. CloudWatch Die Anwendungsüberwachung umfasst auch synthetische Funktionen zur Überwachung Ihrer Endgeräte sowie die Überwachung von echten Benutzern zur Instrumentierung Ihrer Webanwendungsclients. APIs

Implementierungsschritte

Verwenden Sie es AWS X-Ray auf allen unterstützten nativen Diensten wie Amazon S3 und Amazon API Gateway. AWS Lambda Diese AWS Dienste ermöglichen X-Ray mit Konfigurationsumschaltern, die Infrastruktur als Code verwenden AWS SDKs, oder die AWS Management Console.
Instrumentenanwendungen AWS Distro for Open Telemetry und X-Ray oder Erfassungs-Agenten von Drittanbietern.
Im AWS X-Ray -Entwicklerhandbuch finden Sie weitere Informationen für die programmiersprachenspezifische Implementierung. In diesen Abschnitten der Dokumentation wird detailliert beschrieben, wie HTTP Anfragen, SQL Abfragen und andere Prozesse, die für Ihre Anwendungsprogrammiersprache spezifisch sind, instrumentiert werden.
Verwenden Sie X-Ray Tracing für Amazon CloudWatch Synthetic Canaries und Amazon CloudWatch RUM, um den Anforderungspfad von Ihrem Endbenutzer-Client durch Ihre nachgelagerte AWS Infrastruktur zu analysieren.
Konfigurieren Sie CloudWatch Metriken und Alarme auf der Grundlage von Resource Health und Canary-Telemetrie, sodass Teams schnell auf Probleme aufmerksam gemacht werden und sich anschließend eingehend mit Traces und Service Maps befassen können. ServiceLens
Aktivieren Sie die X-Ray-Integration für Nachverfolgungs-Tools von Drittanbietern wie Datadog, New Relic oder Dynatrace, wenn Sie Tools von Drittanbietern als primäre Nachverfolgungslösung verwenden.

Ressourcen

Zugehörige bewährte Methoden:

Zugehörige Dokumente:

Zugehörige Beispiele:

Workshop zur Beobachtbarkeit

Zugehörige Videos:

Zugehörige Tools:

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

REL06-BP06 Regelmäßiges Durchführen von Prüfungen von Umfang und Metriken

Entwerfen einer Workloads, die sich an Bedarfsänderungen anpasst