OPS08-BP03 Analysieren von Workload-Traces - AWS Well-Architected Framework

OPS08-BP03 Analysieren von Workload-Traces

Die Analyse von Trace-Daten ist entscheidend, wenn es darum geht, einen umfassenden Überblick über den Betriebsverlauf einer Anwendung zu erhalten. Durch die Visualisierung und das Verständnis der Interaktionen zwischen verschiedenen Komponenten können die Leistung optimiert, Engpässe identifiziert und das Benutzererlebnis verbessert werden.

Gewünschtes Ergebnis: Sie verschaffen sich einen klaren Überblick über die verteilten Abläufe Ihrer Anwendung und erzielen dadurch eine schnellere Problemlösung und eine verbesserte Benutzererfahrung.

Typische Anti-Muster:

  • Trace-Daten werden übersehen und man verlässt sich ausschließlich auf Protokolle und Metriken.

  • Trace-Daten werden nicht mit zugehörigen Protokollen in Zusammenhang gebracht.

  • Aus Traces abgeleitete Metriken wie Latenz und Fehlerraten werden ignoriert.

Vorteile der Nutzung dieser bewährten Methode:

  • Sie verbessern die Fehlersuche und reduzieren die durchschnittliche Zeit für die Behebung (Mean Time to Resolution, MTTR).

  • Sie gewinnen Erkenntnisse über Abhängigkeiten und deren Auswirkungen.

  • Sie können Leistungsprobleme rasch identifizieren und beheben.

  • Sie nutzen von aus Trace abgeleitete Metriken für fundierte Entscheidungen.

  • Sie erzielen ein besseres Benutzererlebnis durch optimierte Komponenteninteraktionen.

Risikostufe bei fehlender Befolgung dieser bewährten Methode: Mittel

Implementierungsleitfaden

AWS X-Ray bietet eine umfassende Suite für die Analyse von Trace-Daten, die einen ganzheitlichen Überblick über Serviceinteraktionen, die Überwachung von Benutzeraktivitäten und die Erkennung von Leistungsproblemen bietet. Features wie ServiceLens, X-Ray-Insights, X-Ray Analytics und Amazon DevOps Guru erhöhen die Tiefe verwertbarer Erkenntnisse, die aus Trace-Daten gewonnen werden.

Implementierungsschritte

Die folgenden Schritte bieten einen strukturierten Ansatz zur effektiven Implementierung der Trace-Datenanalyse mithilfe von AWS-Services:

  1. Integrieren von AWS X-Ray: Stellen Sie sicher, dass X-Ray in Ihre Anwendungen integriert ist, um Trace-Daten zu erfassen.

  2. Analyse von X-Ray-Metriken: Untersuchen Sie anhand von X-Ray-Traces abgeleitete Metriken wie Latenz, Anfrageraten, Fehlerraten und Antwortzeitverteilungen mithilfe der Service-Übersicht, um den Status der Anwendung zu überwachen.

  3. Verwenden von ServiceLens: Nutzen Sie die ServiceLens-Übersicht für eine verbesserte Beobachtbarkeit Ihrer Services und Anwendungen. Dies ermöglicht eine integrierte Anzeige von Traces, Metriken, Protokollen, Alarmen und anderen Statusinformationen.

  4. Aktivieren von X-Ray-Insights:

    1. Aktivieren Sie X-Ray-Insights zur automatisierten Erkennung von Anomalien in Traces.

    2. Untersuchen Sie Erkenntnisse, um Muster zu identifizieren und die Ursachen zu ermitteln, z. B. erhöhte Fehlerraten oder Latenzen.

    3. Eine chronologische Analyse der erkannten Probleme finden Sie in der Insights-Timeline.

  5. Verwenden von X-Ray Analytics: X-Ray Analytics ermöglicht es Ihnen, Trace-Daten gründlich zu untersuchen, Muster zu lokalisieren und Erkenntnisse zu gewinnen.

  6. Verwenden von Gruppen in X-Ray: Erstellen Sie Gruppen in X-Ray, um Traces nach Kriterien wie hoher Latenz zu filtern und so eine gezieltere Analyse zu ermöglichen.

  7. Integrieren von Amazon DevOps Guru: Setzen Sie Amazon DevOps Guru ein, um von Machine-Learning-Modellen zu profitieren, die betriebliche Anomalien in Traces lokalisieren.

  8. Verwenden von CloudWatch Synthetics: Verwenden Sie CloudWatch Synthetics, um Canarys für die kontinuierliche Überwachung Ihrer Endpunkte und Workflows zu erstellen. Sie können diese Canarys in X-Ray integrieren, um Trace-Daten für eine eingehende Analyse der getesteten Anwendungen bereitzustellen.

  9. Verwenden von Real User Monitoring (RUM): Mit AWS X-Ray und CloudWatch RUM können Sie den Anforderungspfad ausgehend von den Endbenutzern Ihrer Anwendung über nachgelagerte AWS Managed Services analysieren und debuggen. Auf diese Weise können Sie Latenztrends und Fehler identifizieren, die sich auf Ihre Endbenutzer auswirken.

  10. Korrelieren von Daten mit Protokollen:: Bringen Sie Trace-Daten mit zugehörigen Protokollen innerhalb der X-Ray-Trace-Ansicht in Zusammenhang, um eine detaillierte Perspektive auf das Anwendungsverhalten zu erhalten. Auf diese Weise können Sie Protokollereignisse anzeigen, die direkt mit verfolgten Transaktionen verknüpft sind.

  11. Implementieren der kontoübergreifenden Beobachtbarkeit von CloudWatch: Überwachen Sie Anwendungen und beheben Sie Fehler, die sich über mehrere Konten innerhalb einer Region erstrecken.

Aufwand für den Implementierungsplan: Mittel

Ressourcen

Zugehörige bewährte Methoden:

Zugehörige Dokumente:

Zugehörige Videos:

Zugehörige Beispiele: