AWSSupport-TroubleshootOpenSearchHighCPU - AWS Systems Manager Referensi buku runbook otomatisasi

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

AWSSupport-TroubleshootOpenSearchHighCPU

Deskripsi

AWSSupport-TroubleshootOpenSearchHighCPURunbook menyediakan solusi otomatis untuk mengumpulkan data diagnostik dari domain OpenSearch Layanan Amazon untuk memecahkan masalah CPU yang tinggi.

Bagaimana cara kerjanya?

AWSSupport-TroubleshootOpenSearchHighCPURunbook membantu memecahkan masalah pemanfaatan CPU yang tinggi di domain Layanan Amazon. OpenSearch

Runbook melakukan langkah-langkah berikut:

  • Menjalankan DescribeDomainAPI terhadap domain OpenSearch Layanan Amazon yang disediakan untuk mendapatkan metadata klaster.

  • Memeriksa apakah domain OpenSearch Layanan Amazon bersifat publik atau berbasis Amazon VPC dan dengan bantuan AWS CloudFormation, menciptakan fungsi berbasis AWS Lambda VPC publik atau Amazon.

  • Fungsi Lambda mengambil data diagnostik dari domain Layanan Amazon OpenSearch .

  • Menggunakan mesin AWS Step Functions negara untuk mengatur beberapa eksekusi fungsi Lambda untuk mengumpulkan data yang lebih komprehensif.

  • Menyimpan data yang dikumpulkan dalam grup CloudWatch log Amazon selama 24 jam secara default.

  • Menghapus sumber daya yang dibuat, kecuali grup CloudWatch log.

Izin IAM yang diperlukan

AutomationAssumeRoleParameter memerlukan tindakan berikut untuk menggunakan runbook dengan sukses.

  • cloudformation:CreateStack

  • cloudformation:CreateStack

  • cloudformation:DescribeStacks

  • cloudformation:DescribeStackEvents

  • cloudformation:DeleteStack

  • lambda:CreateFunction

  • lambda:DeleteFunction

  • lambda:InvokeFunction

  • lambda:GetFunction

  • lambda:TagResource

  • es:DescribeDomain

  • ec2:DescribeSecurityGroups

  • ec2:DescribeSubnets

  • ec2:DescribeVpcs

  • ec2:DescribeNetworkInterfaces

  • ec2:CreateNetworkInterface

  • ec2:DescribeInstances

  • ec2:AttachNetworkInterface

  • ec2:DeleteNetworkInterface

  • logs:CreateLogGroup

  • logs:PutRetentionPolicy

  • logs:TagResource

  • states:CreateStateMachine

  • states:DeleteStateMachine

  • states:StartExecution

  • states:TagResource

  • states:DescribeStateMachine

  • states:DescribeExecution

  • iam:PassRole

  • iam:CreateRole

  • iam:DeleteRole

  • iam:GetRole

  • iam:PutRolePolicy

  • iam:DeleteRolePolicy

  • ssm:DescribeAutomationExecutions

  • ssm:GetAutomationExecution

LambdaExecutionRoleParameter memerlukan tindakan berikut agar berhasil menggunakan runbook:

  • es:ESHttpGet

  • ec2:CreateNetworkInterface

  • ec2:DescribeNetworkInterfaces

  • ec2:DeleteNetworkInterface

  • logs:CreateLogStream

  • logs:PutLogEvents

Peran eksekusi Lambda memberikan izin fungsi untuk mengakses AWS layanan dan sumber daya yang diperlukan oleh runbook ini. Untuk informasi selengkapnya, silakan lihat Peran eksekusi Lambda.

catatan

Theec2:DescribeNetworkInterfaces,ec2:CreateNetworkInterface, dan hanya ec2:DeleteNetworkInterface diperlukan jika kluster OpenSearch Layanan Anda berbasis Amazon VPC untuk memungkinkan fungsi Lambda membuat dan mengelola antarmuka jaringan VPC Amazon. Untuk informasi selengkapnya, lihat Menghubungkan jaringan keluar ke sumber daya dalam peran eksekusi Amazon VPC dan Lambda.

Instruksi

Ikuti langkah-langkah ini untuk mengonfigurasi otomatisasi:

  1. Arahkan ke AWSSupport- TroubleshootOpenSearchHigh CPU di AWS Systems Manager konsol.

  2. Pilih Jalankan otomatisasi.

  3. Untuk parameter input masukkan yang berikut ini:

    • AutomationAssumeRole (Opsional):

      Nama Sumber Daya Amazon (ARN) dari peran AWS Identity and Access Management (IAM) yang memungkinkan Otomasi Systems Manager untuk melakukan tindakan atas nama Anda. Jika tidak ada peran yang ditentukan, Systems Manager Automation menggunakan izin pengguna yang memulai runbook ini.

    • DomainName (Diperlukan):

      Nama domain OpenSearch Layanan Amazon yang ingin Anda pecahkan masalah CPU yang tinggi.

    • LambdaExecutionRoleForOpenSearch (Diperlukan):

      ARN dari peran IAM untuk dilampirkan ke fungsi Lambda. Fungsi Lambda menggunakan kredensi dari peran ini untuk menandatangani permintaan ke domain Layanan Amazon. OpenSearch Jika kontrol akses berbutir halus diaktifkan di domain OpenSearch Layanan Amazon, Anda harus memetakan peran ini ke peran backend Dasbor OpenSearch Layanan dengan izin minimum “cluster_monitor”.

    • DataRetentionDays (Opsional):

      Jumlah hari untuk menyimpan data diagnostik yang dikumpulkan dari domain OpenSearch Layanan Amazon. Secara default, data disimpan selama 24 jam (satu hari). Anda dapat memilih untuk menyimpan data maksimal hingga 30 hari.

    • NumberOfDataSamples (Opsional):

      Jumlah sampel data yang dikumpulkan dari domain OpenSearch Layanan Amazon. Secara default, 5 sampel data dikumpulkan. Anda dapat mengumpulkan hingga 10 sampel dan fungsi Lambda akan dipanggil untuk setiap koleksi sampel.

  4. Jika Anda telah mengaktifkan kontrol akses berbutir halus pada kluster OpenSearch Service, pastikan bahwa LambdaExecutionRole peran arn dipetakan ke peran dengan setidaknya izin. cluster_monitor

  5. Pilih Jalankan.

  6. Otomatisasi dimulai.

  7. Runbook otomatisasi melakukan langkah-langkah berikut:

    • CheckConcurrency:

      Memastikan bahwa hanya ada satu eksekusi runbook ini yang menargetkan domain OpenSearch Layanan Amazon yang ditentukan. Jika runbook menemukan eksekusi lain yang menargetkan nama domain yang sama, ia mengembalikan kesalahan dan berakhir.

    • getDomainConfig:

      Mendapatkan detail konfigurasi untuk domain OpenSearch Layanan target.

    • ProvisionResources:

      Ketentuan sumber daya untuk pengumpulan data menggunakan AWS CloudFormation.

    • waitForStackPenciptaan:

      Menunggu AWS CloudFormation tumpukan selesai.

    • describeStackResources:

      Menjelaskan AWS CloudFormation tumpukan dan mendapatkan ARN dari mesin negara.

    • runStateMachine:

      Memanggil fungsi Lambda pengumpul data satu kali atau beberapa kali dengan menjalankan mesin status Step Functions.

    • describeErrorsFromStackEvents:

      Menjelaskan kesalahan dari AWS CloudFormation tumpukan untuk kesalahan.

    • unstageOpenSearchHighCPUAutomation:

      Menghapus AWSSupport-TroubleshootOpenSearchHighCPU AWS CloudFormation tumpukan.

    • describeErrorsFromStackDeletion:

      Menjelaskan kesalahan yang ditemui saat menghapus AWS CloudFormation tumpukan.

    • Status akhir:

      Mengembalikan output akhir dari AWSSupport-TroubleshootOpenSearchHighCPU runbook.

  8. Setelah selesai, tinjau bagian Output untuk hasil eksekusi yang terperinci.

    • Status akhir. FinalOutput:

      Menyediakan grup CloudWatch log tempat data diagnostik disimpan.

Referensi

Otomatisasi Systems Manager

AWS dokumentasi layanan