AWSSupport-TroubleshootOpenSearchHighCPU - AWS Systems Manager Riferimento al runbook di automazione

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

AWSSupport-TroubleshootOpenSearchHighCPU

Descrizione

Il AWSSupport-TroubleshootOpenSearchHighCPU runbook fornisce una soluzione automatizzata per raccogliere dati diagnostici da un dominio Amazon OpenSearch Service per risolvere problemi gravi. CPU

Come funziona?

Il AWSSupport-TroubleshootOpenSearchHighCPU runbook aiuta a risolvere i problemi di CPU utilizzo elevato nel dominio Amazon Service. OpenSearch

Il runbook esegue i seguenti passaggi:

  • Esegue DescribeDomainAPIil dominio Amazon OpenSearch Service fornito per ottenere i metadati del cluster.

  • Verifica se il dominio Amazon OpenSearch Service è pubblico o VPC basato su Amazon e, con l'aiuto di AWS CloudFormation, crea una AWS Lambda funzione pubblica o VPCbasata su Amazon.

  • La funzione Lambda recupera i dati diagnostici dai domini di Amazon OpenSearch Service.

  • Utilizza una macchina a AWS Step Functions stati per orchestrare più esecuzioni di funzioni Lambda per raccogliere dati più completi.

  • Per impostazione predefinita, archivia i dati raccolti in un gruppo di CloudWatch log Amazon per 24 ore.

  • Elimina le risorse create, ad eccezione del gruppo di CloudWatch log.

Tipo di documento

Automazione

Proprietario

Amazon

Piattaforme

LinuxmacOS, Windows

Parametri

IAMAutorizzazioni richieste

Il AutomationAssumeRole parametro richiede le seguenti azioni per utilizzare correttamente il runbook.

  • cloudformation:CreateStack

  • cloudformation:CreateStack

  • cloudformation:DescribeStacks

  • cloudformation:DescribeStackEvents

  • cloudformation:DeleteStack

  • lambda:CreateFunction

  • lambda:DeleteFunction

  • lambda:InvokeFunction

  • lambda:GetFunction

  • lambda:TagResource

  • es:DescribeDomain

  • ec2:DescribeSecurityGroups

  • ec2:DescribeSubnets

  • ec2:DescribeVpcs

  • ec2:DescribeNetworkInterfaces

  • ec2:CreateNetworkInterface

  • ec2:DescribeInstances

  • ec2:AttachNetworkInterface

  • ec2:DeleteNetworkInterface

  • logs:CreateLogGroup

  • logs:PutRetentionPolicy

  • logs:TagResource

  • states:CreateStateMachine

  • states:DeleteStateMachine

  • states:StartExecution

  • states:TagResource

  • states:DescribeStateMachine

  • states:DescribeExecution

  • iam:PassRole

  • iam:CreateRole

  • iam:DeleteRole

  • iam:GetRole

  • iam:PutRolePolicy

  • iam:DeleteRolePolicy

  • ssm:DescribeAutomationExecutions

  • ssm:GetAutomationExecution

Il LambdaExecutionRole parametro richiede le seguenti azioni per utilizzare correttamente il runbook:

  • es:ESHttpGet

  • ec2:CreateNetworkInterface

  • ec2:DescribeNetworkInterfaces

  • ec2:DeleteNetworkInterface

  • logs:CreateLogStream

  • logs:PutLogEvents

Il ruolo di esecuzione Lambda concede alla funzione l'autorizzazione ad accedere ai AWS servizi e alle risorse richiesti da questo runbook. Per ulteriori informazioni, consulta Ruolo di esecuzione Lambda.

Nota

I ec2:DescribeNetworkInterfacesec2:CreateNetworkInterface, e ec2:DeleteNetworkInterface sono necessari solo se il cluster di OpenSearch servizi è VPCbasato su Amazon per consentire alla funzione Lambda di creare e gestire le interfacce di VPC rete Amazon. Per ulteriori informazioni, consulta Connessione della rete in uscita alle risorse in un ruolo di esecuzione Amazon VPC e Lambda.

Istruzioni

Segui questi passaggi per configurare l'automazione:

  1. Passa a AWSSupport- TroubleshootOpenSearchHigh CPU nella AWS Systems Manager console.

  2. Seleziona Execute automation (Esegui automazione).

  3. Per i parametri di input, inserisci quanto segue:

    • AutomationAssumeRole (Facoltativo):

      L'Amazon Resource Name (ARN) del ruolo AWS Identity and Access Management (IAM) che consente a Systems Manager Automation di eseguire le azioni per tuo conto. Se non viene specificato alcun ruolo, Systems Manager Automation utilizza le autorizzazioni dell'utente che avvia questo runbook.

    • DomainName (Obbligatorio):

      Il nome del dominio Amazon OpenSearch Service che desideri risolvere per problemi gravi. CPU

    • LambdaExecutionRoleForOpenSearch(Obbligatorio):

      Il ARN IAM ruolo da assegnare alla funzione Lambda. La funzione Lambda utilizza le credenziali di questo ruolo per firmare le richieste al dominio Amazon OpenSearch Service. Se il controllo granulare degli accessi è abilitato sul dominio Amazon OpenSearch Service, devi mappare questo ruolo a un ruolo di backend di OpenSearch Service Dashboards con un minimo di autorizzazione «cluster_monitor».

    • DataRetentionDays (Facoltativo):

      Il numero di giorni per conservare i dati diagnostici raccolti dal dominio Amazon OpenSearch Service. Per impostazione predefinita, i dati vengono conservati per 24 ore (un giorno). Puoi scegliere di conservare i dati per un massimo di 30 giorni.

    • NumberOfDataSamples (Facoltativo):

      Il numero di campioni di dati da raccogliere dal dominio Amazon OpenSearch Service. Per impostazione predefinita, vengono raccolti 5 campioni di dati. È possibile raccogliere fino a 10 campioni e la funzione Lambda verrà richiamata per ogni raccolta di campioni.

    Input parameters form for AWS Systems Manager Automation with fields for roles and settings.
  4. Se hai abilitato il controllo granulare degli accessi su un cluster di OpenSearch servizi, assicurati che il LambdaExecutionRole ruolo arn sia mappato a un ruolo con almeno l'autorizzazione. cluster_monitor

    Cluster permissions section showing cluster_monitor permission granted.
    Backend roles interface showing an AWSIAM role for Lambda execution and options to remove or add roles.
  5. Seleziona Esegui.

  6. L'automazione inizia.

  7. Il runbook di automazione esegue i seguenti passaggi:

    • checkConcurrency:

      Assicura che esista una sola esecuzione di questo runbook destinata al dominio Amazon OpenSearch Service specificato. Se il runbook trova un'altra esecuzione indirizzata allo stesso nome di dominio, restituisce un errore e termina.

    • getDomainConfig:

      Ottiene i dettagli di configurazione per il dominio di OpenSearch servizio di destinazione.

    • provisionResources:

      Fornisce le risorse per la raccolta dei dati utilizzando AWS CloudFormation.

    • waitForStackCreazione:

      Attende il completamento dello AWS CloudFormation stack.

    • describeStackResources:

      Descrive lo AWS CloudFormation stack e ottiene il valore ARN della macchina a stati.

    • runStateMachine:

      Richiama la funzione Lambda del raccoglitore di dati una o più volte eseguendo una macchina a stati Step Functions.

    • describeErrorsFromStackEvents:

      Descrive gli errori presenti nella pila per individuare eventuali errori. AWS CloudFormation

    • unstageOpenSearchH: ighCPUAutomation

      Elimina lo AWSSupport-TroubleshootOpenSearchHighCPU AWS CloudFormation stack.

    • describeErrorsFromStackDeletion:

      Descrive gli errori riscontrati durante l'eliminazione dello stack. AWS CloudFormation

    • finalStatus:

      Restituisce l'output finale del runbook. AWSSupport-TroubleshootOpenSearchHighCPU

  8. Al termine, consulta la sezione Output per i risultati dettagliati dell'esecuzione.

    • finalStatus.FinalOutput:

      Fornisce il gruppo di CloudWatch log in cui sono archiviati i dati diagnostici.

    Output message indicating hot thread data collection completed with log group details.

Riferimenti

Systems Manager Automation

AWS documentazione di servizio