OPS08-BP03 Analysieren von Workload-Traces - Säule „Betriebliche Exzellenz“

OPS08-BP03 Analysieren von Workload-Traces

Die Analyse von Trace-Daten ist entscheidend, wenn es darum geht, einen umfassenden Überblick über den Betriebsverlauf einer Anwendung zu erhalten. Durch die Visualisierung und das Verständnis der Interaktionen zwischen verschiedenen Komponenten können die Leistung optimiert, Engpässe identifiziert und das Benutzererlebnis verbessert werden.

Gewünschtes Ergebnis: Sie verschaffen sich einen klaren Überblick über die verteilten Abläufe Ihrer Anwendung und erzielen dadurch eine schnellere Problemlösung und ein verbessertes Benutzererlebnis.

Typische Anti-Muster:

  • Trace-Daten werden übersehen und man verlässt sich ausschließlich auf Protokolle und Metriken.

  • Trace-Daten werden nicht mit zugehörigen Protokollen in Zusammenhang gebracht.

  • Aus Traces abgeleitete Metriken wie Latenz und Fehlerraten werden ignoriert.

Vorteile der Nutzung dieser bewährten Methode:

  • Sie verbessern die Fehlersuche und reduzieren die durchschnittliche Zeit für die Behebung (Mean Time to Resolution, MTTR).

  • Sie gewinnen Erkenntnisse über Abhängigkeiten und deren Auswirkungen.

  • Sie können Leistungsprobleme rasch identifizieren und beheben.

  • Sie nutzen von aus Trace abgeleitete Metriken für fundierte Entscheidungen.

  • Sie erzielen ein besseres Benutzererlebnis durch optimierte Komponenteninteraktionen.

Risikostufe, wenn diese bewährte Methode nicht eingeführt wird: mittel

Implementierungsleitfaden

AWS X-Ray bietet eine umfassende Suite für die Analyse von Trace-Daten, die einen ganzheitlichen Überblick über Serviceinteraktionen, die Überwachung von Benutzeraktivitäten und die Erkennung von Leistungsproblemen bietet. Features wie ServiceLens, X-Ray Insights, X-Ray Analytics und Amazon DevOps Guru erhöhen die Tiefe verwertbarer Erkenntnisse, die aus Trace-Daten gewonnen werden.

Implementierungsschritte

Die folgenden Schritte bieten einen strukturierten Ansatz zur effektiven Implementierung der Trace-Datenanalyse mithilfe von AWS-Services:

  1. Integrate AWS X-Ray: Stellen Sie sicher, dass in Ihre Anwendungen X-Ray integriert ist, um Trace-Daten zu erfassen.

  2. Analysieren Sie X-Ray Metriken: Untersuchen Sie anhand von X-Ray Traces abgeleitete Metriken wie Latenz, Anforderungsraten, Fehlerraten und Reaktionszeitverteilungen, und verwenden Sie die Service Map, um den Zustand der Anwendung zu überwachen.

  3. Verwendung von ServiceLens: Nutzen Sie die ServiceLens-Map für eine verbesserte Beobachtbarkeit Ihrer Services und Anwendungen. Dies ermöglicht eine integrierte Anzeige von Traces, Metriken, Protokollen, Alarmen und anderen Statusinformationen.

  4. Aktivieren Sie X-Ray Insights:

    1. Aktivieren Sie X-Ray Insights für die automatische Erkennung von Anomalien in Traces.

    2. Untersuchen Sie Erkenntnisse, um Muster zu identifizieren und die Ursachen zu ermitteln, z. B. erhöhte Fehlerraten oder Latenzen.

    3. Eine chronologische Analyse der erkannten Probleme finden Sie in der Insights-Timeline.

  5. Verwendung von X-Ray Analytics: X-Ray Analytics ermöglicht es Ihnen, Daten gründlich zu untersuchen, Muster zu lokalisieren und Erkenntnisse zu gewinnen.

  6. Verwendung von Gruppen in X-Ray: Erstellen Sie Gruppen in X-Ray, um Traces nach Kriterien wie hoher Latenz zu filtern und so eine gezieltere Analyse zu ermöglichen.

  7. Integration von Amazon DevOps Guru: Setzen Sie Amazon DevOps Guru ein, um von Machine-Learning-Modellen zu profitieren, die betriebliche Anomalien in Traces lokalisieren.

  8. Verwendung von CloudWatch Synthetics: Verwenden Sie CloudWatch Synthetics, um Canaries für die kontinuierliche Überwachung Ihrer Endpunkte und Workflows zu erstellen. Sie können diese Canaries in X-Ray integrieren, um Trace-Daten für eine eingehende Analyse der getesteten Anwendungen bereitzustellen.

  9. Verwendung von Real User Monitoring (RUM): Mit AWS X-Ray und CloudWatch RUM können Sie den Anforderungspfad analysieren und debuggen, angefangen bei den Endbenutzern Ihrer Anwendung bis hin zu nachgelagerten AWS-verwalteten Services. Auf diese Weise können Sie Latenztrends und Fehler identifizieren, die sich auf Ihre Endbenutzer auswirken.

  10. Korrelieren mit Protokollen: Korrelieren Sie Trace-Daten mit zugehörigen Protokollen in der X-Ray-Trace-Ansicht, um sich einen detaillierten Überblick über das Anwendungsverhalten zu verschaffen. Auf diese Weise können Sie Protokollereignisse anzeigen, die direkt mit verfolgten Transaktionen verknüpft sind.

  11. Implementieren von kontoübergreifender CloudWatch-Beobachtbarkeit: Überwachen Sie Anwendungen, die sich über mehrere Konten innerhalb einer Region erstrecken, und beheben Sie Fehler.

Aufwand für den Implementierungsplan: mittel

Ressourcen

Zugehörige bewährte Methoden:

Zugehörige Dokumente:

Zugehörige Videos:

Zugehörige Beispiele: