Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Beispiel: Application Signals verwenden, um ein Problem mit dem Betriebsstatus zu beheben
Das folgende Szenario bietet ein Beispiel dafür, wie Application Signals verwendet werden kann, um Ihre Services zu überwachen und Probleme mit der Servicequalität zu identifizieren. Gehen Sie ins Detail, um mögliche Ursachen zu ermitteln und Maßnahmen zur Behebung des Problems zu ergreifen. Dieses Beispiel konzentriert sich auf eine Anwendung für Tierkliniken, die aus mehreren Microservices besteht, die AWS-Services beispielsweise DynamoDB aufrufen.
Jane ist Teil eines DevOps Teams, das für den Betrieb einer Anwendung in einer Tierklinik zuständig ist. Janes Team setzt sich dafür ein, dass die Anwendung hochverfügbar und reaktionsschnell ist. Sie verwenden Servicelevel-Ziele (SLOs), um die Anwendungsleistung anhand dieser geschäftlichen Verpflichtungen zu messen. Sie erhält eine Warnung über mehrere fehlerhafte Servicelevel-Indikatoren (SLIs). Sie öffnet die CloudWatch Konsole und navigiert zur Seite Dienste, auf der sie mehrere Dienste sieht, die sich in einem fehlerhaften Zustand befinden.
Oben auf der Seite sieht Jane, dass visits-service
der Service mit der höchsten Fehlerrate ist. Sie wählt den Link im Diagramm aus, wodurch die Seite mit den Service-Details für den Service geöffnet wird. Sie stellt fest, dass in der Tabelle mit den Service-Vorgängen ein fehlerhafter Vorgang vorliegt. Sie wählt diesen Vorgang aus und sieht im Volumen- und Verfügbarkeitsdiagramm, dass es periodische Spitzen im Aufrufvolumen gibt, die mit Verfügbarkeitseinbrüchen zu korrelieren scheinen.
Um sich die Einbrüche der Serviceverfügbarkeit genauer anzusehen, wählt Jane einen der Verfügbarkeits-Datenpunkte im Diagramm aus. Es öffnet sich eine Leiste mit X-Ray-Traces, die mit dem ausgewählten Datenpunkt korreliert sind. Sie sieht, dass es mehrere Traces gibt, die Fehler enthalten.
Jane wählt eine der korrelierten Traces mit einem Fehlerstatus aus, wodurch die X-Ray-Trace-Detailseite für das ausgewählte Trace geöffnet wird. Jane scrollt nach unten zum Abschnitt Segment-Timeline und folgt dem Aufrufpfad, bis sie feststellt, dass Aufrufe einer DynamoDB-Tabelle Fehler zurückgeben. Sie wählt das DynamoDB-Segment aus und navigiert zur Ausnahmen-Registerkarte in der rechten Leiste.
Jane stellt fest, dass eine DynamoDB-Ressource falsch konfiguriert ist, was bei hohen Kundenanfragen zu Fehlern führt. Der bereitgestellte Durchsatz der DynamoDB-Tabelle wird regelmäßig überschritten, was zu Problemen mit der Service-Verfügbarkeit und fehlerhaften SLIs führt. Auf der Grundlage dieser Informationen ist ihr Team in der Lage, einen höheren Bereitstellungsdurchsatz zu konfigurieren und eine hohe Verfügbarkeit der Anwendung sicherzustellen.