AWSSupport-TroubleshootOpenSearchHighCPU - AWS Systems Manager Referenz zum Automatisierungs-Runbook

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

AWSSupport-TroubleshootOpenSearchHighCPU

Beschreibung

Das -AWSSupport-TroubleshootOpenSearchHighCPURunbook bietet eine automatisierte Lösung zum Sammeln von Diagnosedaten aus einer Amazon- OpenSearch Service-Domain zur Behebung hoher CPU-Probleme.

Wie funktioniert es?

Das AWSSupport-TroubleshootOpenSearchHighCPU Runbook hilft bei der Behebung einer hohen CPU-Auslastung in der Amazon- OpenSearch Service-Domain.

Das Runbook führt die folgenden Schritte aus:

  • Führt die DescribeDomain API für die bereitgestellte Amazon- OpenSearch Service-Domain aus, um die Cluster-Metadaten abzurufen.

  • Prüft AWS CloudFormation, ob die Amazon- OpenSearch Service-Domain öffentlich oder Amazon-VPC-basiert ist und mithilfe von eine öffentliche oder Amazon-VPC-basierte AWS Lambda Funktion erstellt.

  • Die Lambda-Funktion ruft Diagnosedaten aus den Amazon- OpenSearch Service-Domains ab.

  • Verwendet einen - AWS Step Functions Zustandsautomaten, um mehrere Lambda-Funktionsausführungen zu orchestrieren und umfassendere Daten zu sammeln.

  • Speichert die gesammelten Daten standardmäßig 24 Stunden lang in einer Amazon- CloudWatch Protokollgruppe.

  • Löscht die erstellten Ressourcen mit Ausnahme der CloudWatch Protokollgruppe.

Erforderliche IAM-Berechtigungen

Der AutomationAssumeRole Parameter erfordert die folgenden Aktionen, um das Runbook erfolgreich zu verwenden.

  • cloudformation:CreateStack

  • cloudformation:CreateStack

  • cloudformation:DescribeStacks

  • cloudformation:DescribeStackEvents

  • cloudformation:DeleteStack

  • lambda:CreateFunction

  • lambda:DeleteFunction

  • lambda:InvokeFunction

  • lambda:GetFunction

  • lambda:TagResource

  • es:DescribeDomain

  • ec2:DescribeSecurityGroups

  • ec2:DescribeSubnets

  • ec2:DescribeVpcs

  • ec2:DescribeNetworkInterfaces

  • ec2:CreateNetworkInterface

  • ec2:DescribeInstances

  • ec2:AttachNetworkInterface

  • ec2:DeleteNetworkInterface

  • logs:CreateLogGroup

  • logs:PutRetentionPolicy

  • logs:TagResource

  • states:CreateStateMachine

  • states:DeleteStateMachine

  • states:StartExecution

  • states:TagResource

  • states:DescribeStateMachine

  • states:DescribeExecution

  • iam:PassRole

  • iam:CreateRole

  • iam:DeleteRole

  • iam:GetRole

  • iam:PutRolePolicy

  • iam:DeleteRolePolicy

  • ssm:DescribeAutomationExecutions

  • ssm:GetAutomationExecution

Der LambdaExecutionRole Parameter erfordert die folgenden Aktionen, um das Runbook erfolgreich zu verwenden:

  • es:ESHttpGet

  • ec2:CreateNetworkInterface

  • ec2:DescribeNetworkInterfaces

  • ec2:DeleteNetworkInterface

  • logs:CreateLogStream

  • logs:PutLogEvents

Die Lambda-Ausführungsrolle gewährt der Funktion die Berechtigung, auf die für dieses Runbook erforderlichen AWS Services und Ressourcen zuzugreifen. Weitere Informationen finden Sie unter Lambda-Ausführungsrolle.

Anmerkung

Die ec2:DescribeNetworkInterfaces, und ec2:DeleteNetworkInterface sind nur erforderlichec2:CreateNetworkInterface, wenn Ihr OpenSearch Service-Cluster Amazon-VPC-basiert ist, damit die Lambda-Funktion die Amazon-VPC-Netzwerkschnittstellen erstellen und verwalten kann. Weitere Informationen finden Sie unter Verbinden ausgehender Netzwerke mit Ressourcen in einer Amazon VPC und Lambda-Ausführungsrolle.

Anweisungen

Gehen Sie wie folgt vor, um die Automatisierung zu konfigurieren:

  1. Navigieren Sie in der - AWS Systems Manager Konsole zur AWSSupport-TroubleshootOpenSearchHighCPU.

  2. Wählen Sie Execute automation (Automatisierung ausführen).

  3. Geben Sie für die Eingabeparameter Folgendes ein:

    • AutomationAssumeRole (Optional):

      Der Amazon-Ressourcenname (ARN) der AWS Identity and Access Management (IAM)-Rolle, die es Systems Manager Automation ermöglicht, die Aktionen in Ihrem Namen auszuführen. Wenn keine Rolle angegeben ist, verwendet Systems Manager Automation die Berechtigungen des Benutzers, der dieses Runbook startet.

    • DomainName (Erforderlich):

      Der Name der Amazon- OpenSearch Service-Domäne, die Sie bei hohen CPU-Problemen beheben möchten.

    • LambdaExecutionRoleForOpenSearch (Erforderlich):

      Der ARN der IAM-Rolle, die an die Lambda-Funktion angehängt werden soll. Die Lambda-Funktion verwendet die Anmeldeinformationen dieser Rolle, um Anforderungen an die Amazon- OpenSearch Service-Domain zu signieren. Wenn die differenzierte Zugriffskontrolle in der Amazon- OpenSearch Service-Domain aktiviert ist, müssen Sie diese Rolle einer OpenSearch Service-Dashboards-Backend-Rolle mit mindestens der Berechtigung „cluster_monitor“ zuordnen.

    • DataRetentionDays (Optional):

      Die Anzahl der Tage für die Aufbewahrung der von der Amazon- OpenSearch Service-Domain gesammelten Diagnosedaten. Standardmäßig werden die Daten 24 Stunden (ein Tag) lang aufbewahrt. Sie können die Daten maximal 30 Tage lang aufbewahren.

    • NumberOfDataSamples (Optional):

      Die Anzahl der Datenbeispiele, die von der Amazon- OpenSearch Service-Domain gesammelt werden sollen. Standardmäßig werden 5 Datenstichproben gesammelt. Sie können bis zu 10 Stichproben sammeln und die Lambda-Funktion wird für jede Stichprobensammlung aufgerufen.

  4. Wenn Sie die differenzierte Zugriffskontrolle auf einem - OpenSearch Service-Cluster aktiviert haben, stellen Sie sicher, dass der LambdaExecutionRole Rollen-ARN einer Rolle mit mindestens -cluster_monitorBerechtigung zugeordnet ist.

  5. Wählen Sie Ausführen aus.

  6. Die Automatisierung wird initiiert.

  7. Das Automatisierungs-Runbook führt die folgenden Schritte aus:

    • checkConcurrency

      Stellt sicher, dass es nur eine Ausführung dieses Runbooks gibt, die auf die angegebene Amazon- OpenSearch Service-Domain ausgerichtet ist. Wenn das Runbook eine andere Ausführung findet, die auf denselben Domänennamen abzielt, gibt es einen Fehler zurück und endet.

    • getDomainConfig:

      Ruft die Konfigurationsdetails für die Ziel- OpenSearch Service-Domain ab.

    • provisionResources:

      Stellt die Ressourcen für die Datenerfassung mithilfe von bereit AWS CloudFormation.

    • waitForStackErstellung:

      Wartet, bis der AWS CloudFormation Stack abgeschlossen ist.

    • describeStackResources:

      Beschreibt den AWS CloudFormation Stack und ruft den ARN des Zustandsautomaten ab.

    • runStateMachine:

      Ruft die Lambda-Funktion des Datenkollektors einmal oder mehrmals auf, indem ein Step-Functions-Zustandsautomat ausgeführt wird.

    • describeErrorsFromStackEvents:

      Beschreibt Fehler aus dem AWS CloudFormation Stack auf Fehler.

    • unstageOpenSearchHighCPUAutomation:

      Löscht den AWSSupport-TroubleshootOpenSearchHighCPU AWS CloudFormation Stack.

    • describeErrorsFromStackDeletion:

      Beschreibt Fehler, die beim Löschen des AWS CloudFormation Stacks aufgetreten sind.

    • finalStatus:

      Gibt die endgültige Ausgabe des AWSSupport-TroubleshootOpenSearchHighCPU Runbooks zurück.

  8. Nachdem Sie fertig sind, überprüfen Sie den Abschnitt Outputs, um die detaillierten Ergebnisse der Ausführung zu erhalten.

    • finalStatus .FinalOutput:

      Stellt die CloudWatch Protokollgruppe bereit, in der die Diagnosedaten gespeichert sind.

Referenzen

Systems Manager Automation

AWS -Servicedokumentation