PERF05-BP05 Verwenden von Automatisierung zur proaktiven Behebung leistungsbezogener Probleme - AWS Well-Architected Framework

PERF05-BP05 Verwenden von Automatisierung zur proaktiven Behebung leistungsbezogener Probleme

Verwenden Sie wichtige Leistungskennzahlen (KPIs) in Kombination mit Überwachungs- und Warnsystemen, um eine proaktive Behandlung leistungsbezogener Probleme zu ermöglichen.

Typische Anti-Muster:

  • Sie geben dem Betriebspersonal nur die Möglichkeit, betriebliche Änderungen an der Workload vorzunehmen.

  • Sie lassen alle Alarme ohne proaktive Behebung zum Betriebsteam filtern.

Vorteile der Nutzung dieser bewährten Methode: Die proaktive Behebung von Alarmaktionen ermöglicht es dem Support-Personal, sich auf die Elemente zu konzentrieren, die nicht automatisch umsetzbar sind. Dies hilft dem Betriebspersonal, alle Alarme zu bewältigen, ohne überfordert zu werden, und sich stattdessen auf die kritischen Alarme zu konzentrieren.

Risikostufe bei fehlender Befolgung dieser Best Practice: Niedrig

Implementierungsleitfaden

Verwenden Sie Alarme, um automatisierte Aktionen auszulösen und auf diese Weise Probleme nach Möglichkeit zu beheben. Leiten Sie den Alarm an die Personen weiter, die die richtigen Maßnahmen einleiten können, falls keine automatisierte Reaktion möglich ist. Beispielsweise können Sie ein System nutzen, das erwartete Werte wichtiger Leistungskennzahlen (KPIs) prognostiziert und bei Überschreiten bestimmter Schwellenwerte einen Alarm ausgibt. Denkbar ist auch ein Tool, das Bereitstellungen automatisch anhält oder zurücksetzt, wenn sich KPIs außerhalb der erwarteten Werte befinden.

Implementieren Sie Prozesse, die Ihnen Einblick in die Leistung gewähren, während Ihr Workload ausgeführt wird. Entwickeln Sie Dashboards für die Überwachung und legen Sie Leistungsnormen in Form von Grundwerten fest, um zu bestimmen, ob die Workload optimal funktioniert.

Implementierungsschritte

  • Identifizieren und verstehen Sie das Leistungsproblem, das automatisch behoben werden kann. Verwenden Sie Überwachungslösungen von AWS wie Amazon CloudWatch oder AWS X-Ray, damit Sie die Ursache des Problems besser verstehen.

  • Erstellen Sie einen schrittweisen Plan zur Behebung des Problems und einen Prozess, mit dem das Problem automatisch behoben werden kann.

  • Konfigurieren Sie den Auslöser so, dass der Prozess zur Mängelbeseitigung automatisch eingeleitet wird. Sie können beispielsweise einen Auslöser definieren, der eine Instance automatisch neu startet, wenn sie einen bestimmten Schwellenwert für die CPU-Auslastung erreicht.

  • Nutzen Sie AWS-Services und -Technologien, um den Prozess zur Mängelbeseitigung zu automatisieren. Zum Beispiel, AWS Systems Manager Automation bietet eine sichere und skalierbare Möglichkeit, den Prozess zur Mängelbeseitigung zu automatisieren.

  • Testen Sie den automatisierten Prozess zur Mängelbeseitigung in einer Vorproduktionsumgebung.

  • Implementieren Sie nach dem Testen den Prozess zur Mängelbeseitigung in der Produktionsumgebung und überwachen Sie ihn kontinuierlich, um verbesserungswürdige Bereiche zu identifizieren.

Ressourcen

Zugehörige Dokumente:

Zugehörige Videos:

Zugehörige Beispiele: