Memantau metrik OpenSearch klaster dengan Amazon CloudWatch - OpenSearch Layanan Amazon

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memantau metrik OpenSearch klaster dengan Amazon CloudWatch

OpenSearch Layanan Amazon menerbitkan data dari domain Anda ke Amazon. CloudWatch CloudWatch memungkinkan Anda mengambil statistik tentang titik-titik data tersebut sebagai kumpulan data deret waktu yang diurutkan, yang dikenal sebagai metrik. OpenSearch Layanan mengirimkan sebagian besar metrik CloudWatch dalam interval 60 detik. Jika Anda menggunakan volume Tujuan Umum atau EBS Magnetis, metrik volume EBS diperbarui hanya setiap lima menit. Untuk informasi selengkapnya tentang Amazon CloudWatch, lihat Panduan CloudWatch Pengguna Amazon.

Konsol OpenSearch Layanan menampilkan serangkaian bagan berdasarkan data mentah dari CloudWatch. Bergantung pada kebutuhan Anda, Anda mungkin lebih suka melihat data cluster CloudWatch daripada grafik di konsol. Layanan mengarsipkan metrik selama dua minggu sebelum membuangnya. Metrik disediakan tanpa biaya tambahan, tetapi CloudWatch masih dikenakan biaya untuk membuat dasbor dan alarm. Untuk informasi lebih lanjut, lihat harga Amazon CloudWatch.

OpenSearch Layanan menerbitkan metrik berikut ke: CloudWatch

Melihat metrik di CloudWatch

CloudWatch metrik dikelompokkan pertama oleh namespace layanan, dan kemudian oleh berbagai kombinasi dimensi dalam setiap namespace.

Untuk melihat metrik menggunakan konsol CloudWatch
  1. Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/.

  2. Di panel navigasi kiri, temukan Metrik dan pilih Semua metrik. Pilih ES/ OpenSearchService namespace.

  3. Pilih dimensi untuk melihat metrik yang sesuai. Metrik untuk masing-masing simpul berada di dimensi ClientId, DomainName, NodeId. Metrik klaster ada di dimensi Per-Domain, Per-Client Metrics. Beberapa metrik simpul dikumpulkan di tingkat klaster dan dengan demikian termasuk dalam kedua dimensi. Metrik serpihan berada di dimensi ClientId, DomainName, NodeId, ShardRole.

Untuk melihat daftar metrik menggunakan AWS CLI

Jalankan perintah berikut:

aws cloudwatch list-metrics --namespace "AWS/ES"

Menafsirkan grafik kesehatan dalam Layanan OpenSearch

Untuk melihat metrik di OpenSearch Layanan, gunakan tab kesehatan Cluster dan kesehatan Instance. Tab Instance health menggunakan bagan kotak untuk memberikan at-a-glance visibilitas ke kesehatan setiap OpenSearch node:

  • Setiap kotak berwarna menunjukkan rentang nilai untuk simpul selama periode waktu yang ditentukan.

  • Kotak biru mewakili nilai-nilai yang konsisten dengan simpul lainnya. Kotak merah mewakili outlier.

  • Garis putih dalam setiap kotak menunjukkan nilai simpul saat ini.

  • “Whisker” di kedua sisi setiap kotak menunjukkan nilai minimum dan maksimum untuk semua simpul selama periode waktu.

Jika Anda membuat perubahan konfigurasi ke domain Anda, daftar masing-masing instans di tab Kesehatan klaster dan Kesehatan instans sering kali berlipat ganda untuk jangka waktu singkat sebelum kembali ke nomor yang benar. Untuk penjelasan tentang perilaku ini, lihat Membuat perubahan konfigurasi di Amazon OpenSearch Service.

Metrik klaster

Amazon OpenSearch Service menyediakan metrik berikut untuk cluster.

Metrik Deskripsi
ClusterStatus.green

Nilai 1 menunjukkan bahwa semua serpihan indeks dialokasikan untuk simpul dalam klaster.

Statistik yang relevan: Maksimum

ClusterStatus.yellow Nilai 1 menunjukkan bahwa pecahan utama untuk semua indeks dialokasikan ke node di cluster, tetapi pecahan replika untuk setidaknya satu indeks tidak. Untuk informasi selengkapnya, lihat Status klaster kuning.

Statistik yang relevan: Maksimum

ClusterStatus.red

Nilai 1 menunjukkan bahwa serpihan primer dan replika untuk setidaknya satu indeks tidak dialokasikan untuk simpul dalam klaster. Untuk informasi selengkapnya, lihat Status klaster merah.

Statistik yang relevan: Maksimum

Shards.active

Jumlah total aktif serpihan primer dan replika aktif.

Statistik yang relevan: Maksimum, Jumlah

Shards.unassigned

Jumlah serpihan yang tidak dialokasikan ke simpul di klaster.

Statistik yang relevan: Maksimum, Jumlah

Shards.delayedUnassigned

Jumlah serpihan yang alokasi simpulnya telah tertunda oleh pengaturan batas waktu.

Statistik yang relevan: Maksimum, Jumlah

Shards.activePrimary

Jumlah serpihan primer aktif.

Statistik yang relevan: Maksimum, Jumlah

Shards.initializing

Jumlah serpihan yang berada di bawah inisialisasi.

Statistik yang relevan: Jumlah

Shards.relocating

Jumlah serpihan yang berada di bawah relokasi.

Statistik yang relevan: Jumlah

Nodes

Jumlah node di kluster OpenSearch Service, termasuk node master dan UltraWarm node khusus. Untuk informasi selengkapnya, lihat Membuat perubahan konfigurasi di Amazon OpenSearch Service.

Statistik yang relevan: Maksimum

SearchableDocuments

Jumlah total dokumen yang dapat dicari di semua simpul data pada klaster.

Statistik yang relevan: Minimum, Maksimum, Rata-rata

DeletedDocuments

Jumlah total dokumen yang ditandai untuk penghapusan di semua simpul data pada klaster. Dokumen-dokumen ini tidak lagi muncul di hasil pencarian, tetapi OpenSearch hanya menghapus dokumen yang dihapus dari disk selama penggabungan segmen. Metrik ini meningkat setelah permintaan hapus dan menurun setelah gabungan segmen.

Statistik yang relevan: Minimum, Maksimum, Rata-rata

CPUUtilization

Persentase penggunaan CPU untuk simpul data di klaster. Maksimum menunjukkan simpul dengan penggunaan CPU tertinggi. Rata-rata mewakili semua simpul dalam klaster. Metrik ini juga tersedia untuk masing-masing simpul.

Statistik yang relevan: Maksimum, Rata-rata

FreeStorageSpace

Ruang kosong untuk simpul data dalam klaster. Sum menunjukkan total ruang kosong untuk klaster, tetapi Anda harus meninggalkan periode pada satu menit untuk mendapatkan nilai yang akurat. Minimum dan Maximum menunjukkan simpul dengan ruang paling sedikit dan paling bebas, menurut urutannya. Metrik ini juga tersedia untuk masing-masing node. OpenSearch Layanan melempar a ClusterBlockException saat metrik ini mencapai0. Untuk memulihkan, Anda harus menghapus indeks, menambahkan instance yang lebih besar, atau menambahkan penyimpanan berbasis EBS ke instance yang ada. Untuk mempelajari selengkapnya, lihat Kurangnya ruang penyimpanan yang tersedia.

Konsol OpenSearch Layanan menampilkan nilai ini di GiB. CloudWatch Konsol Amazon menampilkannya di MiB.

catatan

FreeStorageSpaceakan selalu lebih rendah dari nilai yang disediakan _cat/allocation API OpenSearch _cluster/stats dan. OpenSearch Layanan mencadangkan persentase ruang penyimpanan pada setiap instance untuk operasi internal. Untuk informasi lebih lanjut, lihat Menghitung persyaratan penyimpanan.

Statistik yang relevan: Minimum, Maksimum, Rata-rata, Jumlah

ClusterUsedSpace

Total penggunaan ruang untuk klaster. Anda harus menyediakan periode pada satu menit untuk mendapatkan nilai yang akurat.

Konsol OpenSearch Layanan menampilkan nilai ini di GiB. CloudWatch Konsol Amazon menampilkannya di MiB.

Statistik yang relevan: Minimum, Maksimum

ClusterIndexWritesBlocked

Menunjukkan apakah klaster Anda menerima atau memblokir permintaan tulis yang masuk. Nilai 0 berarti klaster menerima permintaan. Nilai 1 berarti permintaan diblokir.

Beberapa faktor umum mencakup hal berikut ini: FreeStorageSpace terlalu rendah atau JVMMemoryPressure terlalu tinggi. Untuk mengatasi masalah ini, pertimbangkan untuk menambahkan lebih banyak ruang disk atau menyesuaikan skala klaster Anda.

Statistik yang relevan: Maksimum

JVMMemoryPressure

Persentase maksimum heap Java yang digunakan untuk semua node data di cluster. OpenSearch Layanan menggunakan setengah dari RAM instance untuk heap Java, hingga ukuran heap 32 GiB. Anda dapat menskalakan instans secara vertikal hingga 64 GiB RAM, di mana Anda dapat menskalakan secara horizontal dengan menambahkan instans. Lihat CloudWatch Alarm yang disarankan untuk Layanan Amazon OpenSearch .

Statistik yang relevan: Maksimum

catatan

Logika untuk metrik ini berubah dalam perangkat lunak layanan R20220323. Untuk informasi selengkapnya, lihat catatan rilis.

OldGenJVMMemoryPressure

Persentase maksimum heap Java yang digunakan untuk “generasi lama” pada semua node data di cluster. Metrik ini juga tersedia di tingkat node.

Statistik yang relevan: Maksimum

AutomatedSnapshotFailure

Jumlah snapshot otomatis yang gagal untuk klaster. Nilai 1 menunjukkan ketiadaan snapshot otomatis yang diambil untuk domain dalam 36 jam sebelumnya.

Statistik yang relevan: Minimum, Maksimum

CPUCreditBalance

Sisa kredit CPU yang tersedia untuk simpul data dalam klaster. Kredit CPU memberikan performa inti CPU penuh selama satu menit. Untuk informasi selengkapnya, lihat Kredit CPU di Panduan Developer Amazon EC2. Metrik ini hanya tersedia untuk tipe instans T2.

Statistik yang relevan: Minimum

OpenSearchDashboardsHealthyNodes

Pemeriksaan kesehatan untuk OpenSearch Dasbor. Jika minimum, maksimum, dan rata-rata semuanya sama dengan 1, Dasbor berperilaku normal. Jika Anda memiliki 10 simpul dengan maksimum 1, minimal 0, dan rata-rata 0,7, ini berarti 7 simpul (70%) sehat dan 3 simpul (30%) tidak sehat.

Statistik yang relevan: Minimum, Maksimum, Rata-rata

OpensearchDashboardsReportingFailedRequestSysErrCount

Jumlah permintaan untuk menghasilkan laporan OpenSearch Dasbor yang gagal karena masalah server atau keterbatasan fitur.

Statistik yang relevan: Jumlah

OpensearchDashboardsReportingFailedRequestUserErrCount

Jumlah permintaan untuk menghasilkan laporan OpenSearch Dasbor yang gagal karena masalah klien.

Statistik yang relevan: Jumlah

OpensearchDashboardsReportingRequestCount

Jumlah total permintaan untuk menghasilkan laporan OpenSearch Dasbor.

Statistik yang relevan: Jumlah

OpensearchDashboardsReportingSuccessCount

Jumlah permintaan yang berhasil untuk menghasilkan laporan OpenSearch Dasbor.

Statistik yang relevan: Jumlah

KMSKeyError

Nilai 1 menunjukkan bahwa AWS KMS kunci yang digunakan untuk mengenkripsi data saat istirahat telah dinonaktifkan. Untuk memulihkan domain untuk operasi normal, aktifkan kembali kunci. Konsol menampilkan metrik ini hanya untuk domain yang mengenkripsi data tidak aktif.

Statistik yang relevan: Minimum, Maksimum

KMSKeyInaccessible

Nilai 1 menunjukkan bahwa AWS KMS kunci yang digunakan untuk mengenkripsi data saat istirahat telah dihapus atau dicabut hibahnya ke Layanan. OpenSearch Anda tidak dapat memulihkan domain yang berada dalam keadaan ini. Jika Anda memiliki snapshot manual, Anda dapat menggunakannya untuk memigrasi data domain ke domain baru. Konsol menampilkan metrik ini hanya untuk domain yang mengenkripsi data tidak aktif.

Statistik yang relevan: Minimum, Maksimum

InvalidHostHeaderRequests

Jumlah permintaan HTTP yang dibuat ke OpenSearch cluster yang menyertakan header host yang tidak valid (atau hilang). Permintaan yang valid menyertakan nama host domain sebagai nilai header host. OpenSearch Layanan menolak permintaan yang tidak valid untuk domain akses publik yang tidak memiliki kebijakan akses terbatas. Anda sebaiknya menerapkan kebijakan akses terbatas ke semua domain.

Jika Anda melihat nilai besar untuk metrik ini, konfirmasikan bahwa OpenSearch klien Anda menyertakan nama host domain (dan bukan, misalnya, alamat IP-nya) dalam permintaan mereka.

Statistik yang relevan: Jumlah

OpenSearchRequests(previously ElasticsearchRequests)

Jumlah permintaan yang dibuat ke OpenSearch cluster.

Statistik yang relevan: Jumlah

2xx, 3xx, 4xx, 5xx

Jumlah permintaan ke domain yang menghasilkan kode respon HTTP yang diberikan (2xx, 3xx, 4xx, 5xx).

Statistik yang relevan: Jumlah

ThroughputThrottle

Menunjukkan apakah disk telah dibatasi atau tidak. Throttling terjadi ketika throughput gabungan ReadThroughputMicroBursting dan WriteThroughputMicroBursting lebih tinggi dari throughput maksimum,. MaxProvisionedThroughput MaxProvisionedThroughputadalah nilai yang lebih rendah dari throughput instance atau throughput volume yang disediakan. Nilai 1 menunjukkan bahwa disk telah dibatasi. Nilai 0 menunjukkan perilaku normal.

Untuk informasi tentang throughput instans, lihat Instans yang dioptimalkan Amazon EBS. Untuk informasi tentang throughput volume, lihat Jenis volume Amazon EBS.

Statistik yang relevan: Minimum, Maksimum

Metrik simpul utama khusus

Amazon OpenSearch Service menyediakan metrik berikut untuk node master khusus.

Metrik Deskripsi
MasterCPUUtilization

Persentase maksimum sumber daya CPU yang digunakan oleh simpul utama khusus. Sebaiknya tingkatkan ukuran tipe instans saat metrik ini mencapai 60 persen.

Statistik yang relevan: Maksimum

MasterFreeStorageSpace

Metrik ini tidak relevan dan bisa diabaikan. Layanan tidak menggunakan simpul utama sebagai data simpul.

MasterJVMMemoryPressure

Persentase maksimum tumpukan Java yang digunakan untuk semua simpul utama khusus di klaster. Sebaiknya lakukan pemindahan ke tipe instans yang lebih besar bila metrik ini mencapai 85 persen.

Statistik yang relevan: Maksimum

catatan

Logika untuk metrik ini berubah dalam perangkat lunak layanan R20220323. Untuk informasi selengkapnya, lihat catatan rilis.

MasterOldGenJVMMemoryPressure

Persentase maksimum heap Java yang digunakan untuk “generasi lama” per master node.

Statistik yang relevan: Maksimum

MasterCPUCreditBalance

Kredit CPU yang tersisa tersedia untuk simpul utama khusus dalam klaster. Kredit CPU memberikan performa inti CPU penuh selama satu menit. Untuk informasi selengkapnya, lihat Kredit CPU di Panduan Developer Amazon EC2. Metrik ini hanya tersedia untuk tipe instans T2.

Statistik yang relevan: Minimum

MasterReachableFromNode

Pemeriksaan kondisi untuk pengecualian MasterNotDiscovered. Nilai 1 menunjukkan perilaku normal. Nilai 0 menunjukkan bahwa /_cluster/health/ gagal.

Kegagalan berarti bahwa node master tidak dapat dijangkau dari node sumber. Mereka biasanya hasil dari masalah konektivitas jaringan atau masalah AWS ketergantungan.

Statistik yang relevan: Maksimum

MasterSysMemoryUtilization

Persentase memori simpul utama yang sedang digunakan.

Statistik yang relevan: Maksimum

Metrik volume EBS

Amazon OpenSearch Service menyediakan metrik berikut untuk volume EBS.

Metrik Deskripsi
ReadLatency

Latensi, dalam hitungan detik, untuk operasi baca pada volume EBS. Metrik ini juga tersedia untuk masing-masing simpul.

Statistik yang relevan: Minimum, Maksimum, Rata-rata

WriteLatency

Latensi, dalam hitungan detik, untuk operasi tulis pada volume EBS. Metrik ini juga tersedia untuk masing-masing simpul.

Statistik yang relevan: Minimum, Maksimum, Rata-rata

ReadThroughput

Throughput, dalam byte per detik, untuk operasi baca pada volume EBS. Metrik ini juga tersedia untuk masing-masing simpul.

Statistik yang relevan: Minimum, Maksimum, Rata-rata

ReadThroughputMicroBursting

Throughput, dalam byte per detik, untuk operasi baca pada volume EBS saat ledakan mikro dipertimbangkan. Metrik ini juga tersedia untuk masing-masing simpul. Micro-bursting terjadi ketika volume EBS meledak IOPS tinggi atau throughput untuk periode waktu yang jauh lebih pendek (kurang dari satu menit).

Statistik yang relevan: Minimum, Maksimum, Rata-rata

WriteThroughput

Throughput, dalam byte per detik, untuk operasi tulis pada volume EBS. Metrik ini juga tersedia untuk masing-masing simpul.

Statistik yang relevan: Minimum, Maksimum, Rata-rata

WriteThroughputMicroBursting

Throughput, dalam byte per detik, untuk operasi penulisan pada volume EBS saat micro-bursting dipertimbangkan. Metrik ini juga tersedia untuk masing-masing simpul. Micro-bursting terjadi ketika volume EBS meledak IOPS tinggi atau throughput untuk periode waktu yang jauh lebih pendek (kurang dari satu menit).

Statistik yang relevan: Minimum, Maksimum, Rata-rata

DiskQueueDepth

Jumlah permintaan input dan output (I/O) yang tertunda untuk volume EBS.

Statistik yang relevan: Minimum, Maksimum, Rata-rata

ReadIOPS

Jumlah operasi input dan output (I/O) per detik untuk operasi baca pada volume EBS. Metrik ini juga tersedia untuk masing-masing simpul.

Statistik yang relevan: Minimum, Maksimum, Rata-rata

ReadIOPSMicroBursting

Jumlah operasi input dan output (I/O) per detik untuk operasi baca pada volume EBS saat micro-bursting dipertimbangkan. Metrik ini juga tersedia untuk masing-masing simpul. Micro-bursting terjadi ketika volume EBS meledak IOPS tinggi atau throughput untuk periode waktu yang jauh lebih pendek (kurang dari satu menit).

Statistik yang relevan: Minimum, Maksimum, Rata-rata

WriteIOPS

Jumlah operasi input dan output (I/O) per detik untuk operasi tulis pada volume EBS. Metrik ini juga tersedia untuk masing-masing simpul.

Statistik yang relevan: Minimum, Maksimum, Rata-rata

WriteIOPSMicroBursting

Jumlah operasi input dan output (I/O) per detik untuk operasi tulis pada volume EBS saat micro-bursting dipertimbangkan. Metrik ini juga tersedia untuk masing-masing simpul. Micro-bursting terjadi ketika volume EBS meledak IOPS tinggi atau throughput untuk periode waktu yang jauh lebih pendek (kurang dari satu menit).

Statistik yang relevan: Minimum, Maksimum, Rata-rata

BurstBalance

Persentase kredit input dan output (I/O) yang tersisa di bucket burst untuk volume EBS. Nilai 100 berarti bahwa volume telah mengumpulkan jumlah kredit maksimum. Jika persentase ini turun di bawah 70%, lihatKeseimbangan burst EBS rendah. Saldo burst tetap pada 0 untuk domain dengan tipe volume gp3, dan domain dengan volume gp2 yang memiliki ukuran volume di atas 1000 GiB.

Statistik yang relevan: Minimum, Maksimum, Rata-rata

Metrik instans

Amazon OpenSearch Service menyediakan metrik berikut untuk setiap instans dalam domain. OpenSearch Layanan juga menggabungkan metrik instans ini untuk memberikan wawasan tentang kesehatan klaster secara keseluruhan. Anda dapat memverifikasi perilaku ini dengan menggunakan statistik Jumlah Sampel dalam konsol. Perhatikan bahwa setiap metrik dalam tabel berikut memiliki statistik yang relevan untuk simpul dan klaster.

penting

Versi yang berbeda dari Elasticsearch menggunakan kolam utas yang berbeda untuk memproses panggilan ke API _index. Elasticsearch 1.5 dan 2.3 menggunakan kolam utas indeks. Elasticsearch 5. x, 6.0, dan 6.2 menggunakan kumpulan utas massal. OpenSearch dan Elasticsearch 6.3 dan yang lebih baru gunakan kumpulan utas tulis. Saat ini, konsol OpenSearch Layanan tidak menyertakan grafik untuk kumpulan utas massal.

Gunakan GET _cluster/settings?include_defaults=true untuk memeriksa kolam utas dan ukuran antrean untuk klaster Anda.

Metrik Deskripsi
IndexingLatency

Perbedaan total waktu, dalam milidetik, diambil oleh semua operasi pengindeksan dalam simpul antara menit N dan menit (N-1).

Statistik simpul yang relevan: Rata-rata

Statistik klaster yang relevan: Rata-rata, Maksimum

IndexingRate

Jumlah operasi pengindeksan per menit. Satu panggilan ke API _bulk yang menambahkan dua dokumen dan memperbarui dua dianggap sebagai empat operasi, yang mungkin tersebar di satu atau beberapa simpul. Jika indeks yang memiliki satu atau beberapa replika, simpul lain dalam klaster juga mencatat total empat operasi pengindeksan. Penghapusan dokumen tidak dihitung dalam metrik ini.

Statistik simpul yang relevan: Rata-rata

Statistik klaster yang relevan: Rata-rata, Maksimum, Sum

SearchLatency

Perbedaan total waktu, dalam milidetik, diambil oleh semua pencarian dalam simpul antara menit N dan menit (N-1).

Statistik simpul yang relevan: Rata-rata

Statistik klaster yang relevan: Rata-rata, Maksimum

SearchRate

Jumlah total permintaan pencarian per menit untuk semua serpihan pada simpul data. Satu panggilan ke API _search mungkin mengembalikan hasilnya dari banyak serpihan yang berbeda. Jika lima serpihan ini berada pada satu simpul, simpul tersebut akan melaporkan 5 untuk metrik ini, meskipun klien hanya membuat satu permintaan.

Statistik simpul yang relevan: Rata-rata

Statistik klaster yang relevan: Rata-rata, Maksimum, Sum

SegmentCount

Jumlah segmen pada simpul data. Semakin banyak segmen yang Anda miliki, semakin lama setiap pencarian berlangsung. OpenSearch kadang-kadang menggabungkan segmen yang lebih kecil menjadi yang lebih besar.

Statistik simpul yang relevan: Maksimum, Rata-rata

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

SysMemoryUtilization

Persentase memori instans yang sedang digunakan. Nilai tinggi untuk metrik ini normal dan biasanya tidak mewakili masalah dengan klaster Anda. Untuk indikator yang lebih baik mengenai potensi masalah performa dan stabilitas, lihat metrik JVMMemoryPressure.

Statistik simpul yang relevan: Minimum, Maksimum, Rata-rata

Statistik klaster yang relevan: Minimum, Maksimum, Rata-rata

JVMGCYoungCollectionCount

Frekuensi pengumpulan sampah "generasi muda" telah berjalan. Jumlah eksekusi yang besar dan terus bertambah adalah bagian normal dari operasi klaster.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

JVMGCYoungCollectionTime

Jumlah waktu, dalam milidetik, yang telah klaster habiskan untuk melakukan pengumpulan sampah "generasi muda".

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

JVMGCOldCollectionCount

Frekuensi pengumpulan sampah "generasi tua" telah berjalan. Dalam sebuah klaster dengan sumber daya yang cukup, jumlah ini harus tetap kecil dan jarang bertumbuh.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

JVMGCOldCollectionTime

Jumlah waktu, dalam milidetik, yang telah klaster habiskan untuk melakukan pengumpulan sampah "generasi tua".

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

OpenSearchDashboardsConcurrentConnections

Jumlah koneksi konkuren aktif ke OpenSearch Dasbor. Jika nomor ini selalu tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

OpenSearchDashboardsHealthyNode

Pemeriksaan kesehatan untuk node OpenSearch Dasbor individu. Nilai 1 menunjukkan perilaku normal. Nilai 0 menunjukkan bahwa Dasbor tidak dapat diakses.

Statistik simpul yang relevan: Minimum

Statistik klaster yang relevan: Minimum, Maksimum, Rata-rata

OpenSearchDashboardsHeapTotal

Jumlah memori heap yang dialokasikan ke OpenSearch Dasbor di MiB. Tipe instans EC2 yang berbeda dapat mempengaruhi alokasi memori yang tepat.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

OpenSearchDashboardsHeapUsed

Jumlah absolut memori heap yang digunakan oleh OpenSearch Dasbor di MiB.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

OpenSearchDashboardsHeapUtilization

Persentase maksimum memori heap yang tersedia yang digunakan oleh OpenSearch Dasbor. Jika nilai ini meningkat di atas 80%, pertimbangkan untuk menyesuaikan skala klaster Anda.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Minimum, Maksimum, Rata-rata

OpenSearchDashboardsOS1MinuteLoad

Rata-rata beban CPU satu menit untuk OpenSearch Dasbor. Beban CPU idealnya harus tetap di bawah 1.00. Meskipun lonjakan sementara tidak masalah, Anda sebaiknya meningkatkan ukuran tipe instans jika metrik ini terus di atas 1.00.

Statistik simpul yang relevan: Rata-rata

Statistik klaster yang relevan: Rata-rata, Maksimum

OpenSearchDashboardsRequestTotal

Jumlah total permintaan HTTP yang dibuat ke OpenSearch Dashboards. Jika sistem Anda lambat atau Anda melihat jumlah permintaan Dasbor yang tinggi, pertimbangkan untuk meningkatkan ukuran jenis instans.

Statistik simpul yang relevan: Jumlah

Statistik klaster yang relevan: Jumlah

OpenSearchDashboardsResponseTimesMaxInMillis

Jumlah waktu maksimum, dalam milidetik, yang dibutuhkan OpenSearch Dasbor untuk menanggapi permintaan. Jika permintaan terus memakan waktu lama untuk mengembalikan hasilnya, pertimbangkan untuk meningkatkan ukuran tipe instans.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Maksimum, Rata-rata

SearchTaskCancelled

Jumlah pembatalan node koordinator.

Statistik simpul yang relevan: Jumlah

Statistik klaster yang relevan: Jumlah

SearchShardTaskCancelled

Jumlah pembatalan node data.

Statistik simpul yang relevan: Jumlah

Statistik klaster yang relevan: Jumlah,

ThreadpoolForce_mergeQueue

Jumlah antrean tugas dalam kolam utas gabungan daya. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

ThreadpoolForce_mergeRejected

Jumlah tugas yang ditolak dalam kolam utas gabungan daya. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah

ThreadpoolForce_mergeThreads

Ukuran kolam utas gabungan daya.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Sum

ThreadpoolIndexQueue

Jumlah antrean tugas dalam kolam utas indeks. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda. Ukuran antrean indeks maksimum adalah 200.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

ThreadpoolIndexRejected

Jumlah tugas yang ditolak dalam kolam utas indeks. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah

ThreadpoolIndexThreads

Ukuran kolam utas indeks.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Jumlah

ThreadpoolSearchQueue

Jumlah antrean tugas di kolam utas pencarian. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda. Ukuran antrean pencarian maksimum adalah 1.000.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

ThreadpoolSearchRejected

Jumlah tugas yang ditolak dalam kolam utas pencarian. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah

ThreadpoolSearchThreads

Ukuran kolam utas pencarian.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Jumlah

Threadpoolsql-workerQueue

Jumlah antrean tugas di kolam utas pencarian SQL. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

Threadpoolsql-workerRejected

Jumlah tugas yang ditolak dalam kolam utas pencarian SQL. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah

Threadpoolsql-workerThreads

Ukuran kolam utas pencarian SQL.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Jumlah

ThreadpoolBulkQueue

Jumlah antrean tugas dalam kolam utas massal. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

ThreadpoolBulkRejected

Jumlah tugas yang ditolak dalam kolam utas massal. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah

ThreadpoolBulkThreads

Ukuran kolam utas massal.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Jumlah

ThreadpoolWriteThreads

Ukuran kolam utas tulis.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Jumlah

ThreadpoolWriteQueue

Jumlah antrean tugas dalam kolam utas tulis.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Jumlah

ThreadpoolWriteRejected

Jumlah tugas yang ditolak dalam kolam utas tulis.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Sum

catatan

Karena ukuran antrian tulis default ditingkatkan dari 200 menjadi 10000 di versi 7.1, metrik ini bukan lagi satu-satunya indikator penolakan dari Layanan. OpenSearch Gunakan ReplicaWriteRejected metrikCoordinatingWriteRejected,PrimaryWriteRejected, dan untuk memantau penolakan di versi 7.1 dan yang lebih baru.

CoordinatingWriteRejected

Jumlah total penolakan terjadi pada node koordinasi karena tekanan pengindeksan sejak startup proses OpenSearch Service terakhir.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Sum

Metrik ini tersedia dalam versi 7.1 ke atas.

PrimaryWriteRejected

Jumlah total penolakan terjadi pada pecahan primer karena tekanan pengindeksan sejak startup proses OpenSearch Layanan terakhir.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Sum

Metrik ini tersedia dalam versi 7.1 ke atas.

ReplicaWriteRejected

Jumlah total penolakan terjadi pada pecahan replika karena tekanan pengindeksan sejak proses Layanan terakhir OpenSearch dimulai.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Sum

Metrik ini tersedia dalam versi 7.1 ke atas.

UltraWarm metrik

Amazon OpenSearch Service menyediakan metrik berikut untuk UltraWarmnode.

Metrik Deskripsi
WarmCPUUtilization

Persentase penggunaan CPU untuk UltraWarm node di cluster. Maksimum menunjukkan simpul dengan penggunaan CPU tertinggi. Rata-rata mewakili semua UltraWarm node dalam cluster. Metrik ini juga tersedia untuk masing-masing UltraWarm node.

Statistik yang relevan: Maksimum, Rata-rata

WarmFreeStorageSpace

Jumlah ruang penyimpanan hangat bebas di MiB. Karena UltraWarm menggunakan Amazon S3 daripada disk terlampir, Sum adalah satu-satunya statistik yang relevan. Anda harus menyediakan periode pada satu menit untuk mendapatkan nilai yang akurat.

Statistik yang relevan: Jumlah

WarmSearchableDocuments

Jumlah total dokumen yang dapat dicari di semua indeks hangat di cluster. Anda harus menyediakan periode pada satu menit untuk mendapatkan nilai yang akurat.

Statistik yang relevan: Jumlah

WarmSearchLatency

Perbedaan total waktu, dalam milidetik, diambil oleh semua pencarian di UltraWarm antara menit N dan menit (N-1).

Statistik simpul yang relevan: Rata-rata

Statistik klaster yang relevan: Rata-rata, Maksimum

WarmSearchRate

Jumlah total permintaan pencarian per menit untuk semua pecahan pada sebuah UltraWarm node. Satu panggilan ke API _search mungkin mengembalikan hasilnya dari banyak serpihan yang berbeda.. Jika lima serpihan ini berada pada satu simpul, simpul tersebut akan melaporkan 5 untuk metrik ini, meskipun klien hanya membuat satu permintaan.

Statistik simpul yang relevan: Rata-rata

Statistik klaster yang relevan: Rata-rata, Maksimum, Jumlah

WarmStorageSpaceUtilization

Jumlah total ruang penyimpanan hangat, di MiB, yang digunakan klaster.

Statistik yang relevan: Maksimum

HotStorageSpaceUtilization

Jumlah total ruang penyimpanan panas yang digunakan klaster.

Statistik yang relevan: Maksimum

WarmSysMemoryUtilization

Persentase memori simpul hangat yang sedang digunakan.

Statistik yang relevan: Maksimum

HotToWarmMigrationQueueSize

Jumlah indeks yang saat ini menunggu untuk bermigrasi dari penyimpanan panas ke penyimpanan hangat.

Statistik yang relevan: Maksimum

WarmToHotMigrationQueueSize

Jumlah indeks yang saat ini menunggu untuk bermigrasi dari penyimpanan hangat ke penyimpanan panas.

Statistik yang relevan: Maksimum

HotToWarmMigrationFailureCount

Jumlah total migrasi panas ke hangat yang gagal.

Statistik yang relevan: Jumlah

HotToWarmMigrationForceMergeLatency

Latensi rata-rata tahap gabungan daya dari proses migrasi. Jika tahap ini secara konsisten memakan waktu terlalu lama, pertimbangkan untuk meningkatkan index.ultrawarm.migration.force_merge.max_num_segments.

Statistik yang relevan: Rata-rata

HotToWarmMigrationSnapshotLatency

Latensi rata-rata tahap snapshot dari proses migrasi. Jika tahap ini secara konsisten memakan waktu terlalu lama, pastikan bahwa serpihan Anda tepat ukuran dan didistribusikan di seluruh klaster.

Statistik yang relevan: Rata-rata

HotToWarmMigrationProcessingLatency

Latensi rata-rata pada migrasi panas ke hangat yang sukses, tidak termasuk waktu yang dihabiskan dalam antrean. Nilai ini adalah jumlah dari seluruh waktu yang dibutuhkan untuk menyelesaikan gabungan daya, snapshot, dan tahap relokasi serpihan dari proses migrasi.

Statistik yang relevan: Rata-rata

HotToWarmMigrationSuccessCount

Jumlah total migrasi panas ke hangat yang berhasil.

Statistik yang relevan: Jumlah

HotToWarmMigrationSuccessLatency

Latensi rata-rata pada migrasi panas ke hangat yang sukses, termasuk waktu yang dihabiskan dalam antrean.

Statistik yang relevan: Rata-rata

WarmThreadpoolSearchThreads

Ukuran kumpulan utas UltraWarm pencarian.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Rata-rata, Sum

WarmThreadpoolSearchRejected

Jumlah tugas yang ditolak di kumpulan thread UltraWarm pencarian. Jika angka ini terus bertambah, pertimbangkan untuk menambahkan lebih banyak UltraWarm node.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah

WarmThreadpoolSearchQueue Jumlah tugas antrian di kumpulan utas UltraWarm pencarian. Jika ukuran antrian tinggi secara konsisten, pertimbangkan untuk menambahkan lebih banyak UltraWarm node.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

WarmJVMMemoryPressure

Persentase maksimum heap Java yang digunakan untuk UltraWarm node.

Statistik yang relevan: Maksimum

catatan

Logika untuk metrik ini berubah dalam perangkat lunak layanan R20220323. Untuk informasi selengkapnya, lihat catatan rilis.

WarmOldGenJVMMemoryPressure

Persentase maksimum heap Java yang digunakan untuk “generasi lama” per UltraWarm node.

Statistik yang relevan: Maksimum

WarmJVMGCYoungCollectionCount

Berapa kali pengumpulan sampah “generasi muda” berjalan di UltraWarm node. Jumlah eksekusi yang besar dan terus bertambah adalah bagian normal dari operasi klaster.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

WarmJVMGCYoungCollectionTime

Jumlah waktu, dalam milidetik, yang dihabiskan cluster untuk melakukan pengumpulan sampah “generasi muda” di UltraWarm node.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

WarmJVMGCOldCollectionCount

Berapa kali pengumpulan sampah “generasi lama” berjalan di UltraWarm node. Dalam sebuah klaster dengan sumber daya yang cukup, jumlah ini harus tetap kecil dan jarang bertumbuh.

Statistik simpul yang relevan: Maksimum

Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata

Metrik penyimpanan dingin

Amazon OpenSearch Service menyediakan metrik berikut untuk penyimpanan dingin.

Metrik Deskripsi
ColdStorageSpaceUtilization

Jumlah total ruang penyimpanan dingin, di MiB, yang digunakan klaster.

Statistik yang relevan: Maks

ColdToWarmMigrationFailureCount

Jumlah total migrasi dingin ke hangat yang gagal.

Statistik yang relevan: Jumlah

ColdToWarmMigrationLatency

Jumlah waktu yang diperlukan untuk berhasil menyelesaikan migrasi dingin ke hangat.

Statistik yang relevan: Rata-rata

ColdToWarmMigrationQueueSize

Jumlah indeks yang saat ini menunggu untuk bermigrasi dari penyimpanan dingin ke penyimpanan hangat.

Statistik yang relevan: Maksimum

ColdToWarmMigrationSuccessCount

Jumlah total migrasi dingin ke hangat yang berhasil.

Statistik yang relevan: Jumlah

WarmToColdMigrationFailureCount

Jumlah total migrasi hangat ke dingin yang gagal.

Statistik yang relevan: Jumlah

WarmToColdMigrationLatency

Jumlah waktu yang diperlukan untuk berhasil menyelesaikan migrasi hangat ke dingin.

Statistik yang relevan: Rata-rata

WarmToColdMigrationQueueSize

Jumlah indeks yang saat ini menunggu untuk bermigrasi dari penyimpanan hangat ke penyimpanan dingin.

Statistik yang relevan: Maksimum

WarmToColdMigrationSuccessCount

Jumlah total migrasi hangat ke dingin yang berhasil.

Statistik yang relevan: Jumlah

Metrik OR1

Amazon OpenSearch Service menyediakan metrik berikut untuk instans OR1.

Metrik Deskripsi
RemoteStorageUsedSpace

Jumlah total ruang Amazon S3, di MiB, yang digunakan cluster.

Statistik yang relevan: Jumlah

RemoteStorageWriteRejected

Jumlah total permintaan yang ditolak pada pecahan primer karena penyimpanan jarak jauh dan tekanan replikasi. Ini dihitung mulai dari startup proses OpenSearch Layanan terakhir.

Statistik yang relevan: Jumlah

Metrik pemberitahuan

Amazon OpenSearch Service menyediakan metrik berikut untuk peringatan.

Metrik Deskripsi
AlertingDegraded

Nilai 1 berarti indeks pemberitahuan berwarna merah atau satu atau beberapa simpul tidak sesuai jadwal. Nilai 0 menunjukkan perilaku normal.

Statistik yang relevan: Maksimum

AlertingIndexExists

Nilai 1 berarti indeks .opensearch-alerting-config tersedia. Nilai 0 berarti indeks tidak tersedia. Sampai Anda menggunakan fitur peringatan untuk pertama kalinya, nilai ini tetap 0.

Statistik yang relevan: Maksimum

AlertingIndexStatus.green

Kesehatan indeks. Nilai 1 berarti hijau. Nilai 0 berarti indeks tidak tersedia atau tidak hijau.

Statistik yang relevan: Maksimum

AlertingIndexStatus.red

Kesehatan indeks. Nilai 1 berarti merah. Nilai 0 berarti indeks tidak tersedia atau tidak merah.

Statistik yang relevan: Maksimum

AlertingIndexStatus.yellow

Kesehatan indeks. Nilai 1 berarti kuning. Nilai 0 berarti indeks tidak tersedia atau tidak kuning.

Statistik yang relevan: Maksimum

AlertingNodesNotOnSchedule

Nilai 1 berarti beberapa tugas tidak berjalan sesuai jadwal. Nilai 0 berarti semua tugas pemberitahuan berjalan sesuai jadwal (atau bahwa tidak terdapat tugas pemberitahuan). Periksa konsol OpenSearch Layanan atau buat _nodes/stats permintaan untuk melihat apakah ada node yang menunjukkan penggunaan sumber daya yang tinggi.

Statistik yang relevan: Maksimum

AlertingNodesOnSchedule

Nilai 1 berarti semua tugas pemberitahuan berjalan sesuai jadwal (atau bahwa tidak terdapat tugas pemberitahuan). Nilai 0 berarti beberapa tugas tidak berjalan sesuai jadwal.

Statistik yang relevan: Maksimum

AlertingScheduledJobEnabled

Nilai 1 berarti Pengaturan klaster opensearch.scheduled_jobs.enabled betul. Nilai 0 berarti itu adalah salah, dan tugas yang dijadwalkan dinonaktifkan.

Statistik yang relevan: Maksimum

Metrik deteksi anomali

Amazon OpenSearch Service menyediakan metrik berikut untuk deteksi anomali.

Metrik Deskripsi
ADPluginUnhealthy

Nilai 1 berarti bahwa plugin deteksi anomali tidak berfungsi dengan baik, baik karena jumlah kegagalan yang tinggi atau karena salah satu indeks yang digunakannya berwarna merah. Nilai 0 menunjukkan plugin bekerja seperti yang diharapkan.

Statistik yang relevan: Maksimum

ADExecuteRequestCount

Jumlah permintaan untuk mendeteksi anomali.

Statistik yang relevan: Jumlah

ADExecuteFailureCount

Jumlah permintaan gagal untuk mendeteksi anomali.

Statistik yang relevan: Jumlah

ADHCExecuteFailureCount

Jumlah permintaan gagal untuk mendeteksi anomali pada detektor kardinalitas tinggi.

Statistik yang relevan: Jumlah

ADHCExecuteRequestCount

Jumlah permintaan untuk mendeteksi anomali pada detektor kardinalitas tinggi.

Statistik yang relevan: Jumlah

ADAnomalyResultsIndexStatusIndexExists

Nilai 1 berarti indeks yang menurut alias .opensearch-anomaly-results tersedia. Sampai Anda menggunakan deteksi anomali untuk pertama kalinya, nilai ini tetap 0.

Statistik yang relevan: Maksimum

ADAnomalyResultsIndexStatus.red

Nilai 1 berarti indeks yang menurut alias .opensearch-anomaly-results berwarna merah. Nilai 0 berarti indeks tidak berwarna merah. Sampai Anda menggunakan deteksi anomali untuk pertama kalinya, nilai ini tetap 0.

Statistik yang relevan: Maksimum

ADAnomalyDetectorsIndexStatusIndexExists

Nilai 1 berarti indeks .opensearch-anomaly-detectors tersedia. Nilai 0 berarti indeks tidak tersedia. Sampai Anda menggunakan deteksi anomali untuk pertama kalinya, nilai ini tetap 0.

Statistik yang relevan: Maksimum

ADAnomalyDetectorsIndexStatus.red

Nilai 1 berarti indeks .opensearch-anomaly-detectors berwarna merah. Nilai 0 berarti indeks tidak berwarna merah. Sampai Anda menggunakan deteksi anomali untuk pertama kalinya, nilai ini tetap 0.

Statistik yang relevan: Maksimum

ADModelsCheckpointIndexStatusIndexExists

Nilai 1 berarti indeks .opensearch-anomaly-checkpoints tersedia. Nilai 0 berarti indeks tidak tersedia. Sampai Anda menggunakan deteksi anomali untuk pertama kalinya, nilai ini tetap 0.

Statistik yang relevan: Maksimum

ADModelsCheckpointIndexStatus.red

Nilai 1 berarti indeks .opensearch-anomaly-checkpoints berwarna merah. Nilai 0 berarti indeks tidak berwarna merah. Sampai Anda menggunakan deteksi anomali untuk pertama kalinya, nilai ini tetap 0.

Statistik yang relevan: Maksimum

Amazon OpenSearch Service menyediakan metrik berikut untuk pencarian asinkron.

Statistik simpul koordinator pencarian asinkron (per node koordinator)

Metrik Deskripsi
AsynchronousSearchSubmissionRate

Jumlah pencarian asinkron yang dikirimkan di menit terakhir.

AsynchronousSearchInitializedRate

Jumlah pencarian asinkron yang diinisialisasi di menit terakhir.

AsynchronousSearchRunningCurrent

Jumlah pencarian asinkron yang saat ini berjalan.

AsynchronousSearchCompletionRate

Jumlah pencarian asinkron yang berhasil diselesaikan di menit terakhir.

AsynchronousSearchFailureRate

Jumlah pencarian asinkron yang diselesaikan dan gagal di menit terakhir.

AsynchronousSearchPersistRate

Jumlah pencarian asinkron yang bertahan di menit terakhir.

AsynchronousSearchPersistFailedRate

Jumlah pencarian asinkron yang tidak bertahan di menit terakhir.

AsynchronousSearchRejected

Jumlah total pencarian asinkron yang ditolak sejak waktu aktif simpul.

AsynchronousSearchCancelled

Jumlah total pencarian asinkron yang dibatalkan sejak waktu aktif simpul.

AsynchronousSearchMaxRunningTime

Durasi pencarian asinkron terpanjang berjalan pada simpul di menit terakhir.

Statistik klaster pencarian asinkron

Metrik Deskripsi
AsynchronousSearchStoreHealth

Kondisi penyimpanan dalam indeks bertahan (MERAH/non-MERAH) di menit terakhir.

AsynchronousSearchStoreSize

Ukuran indeks sistem pada semua serpihan di menit terakhir.

AsynchronousSearchStoredResponseCount

Jumlah tanggapan yang tersimpan dalam indeks sistem di menit terakhir.

Metrik Penyetelan Otomatis

Amazon OpenSearch Service menyediakan metrik berikut untuk Auto-Tune.

Metrik Deskripsi
AutoTuneChangesHistoryHeapSize

Riwayat perubahan di MiB untuk nilai penyetelan ukuran heap.

AutoTuneChangesHistoryJVMYoungGenArgs

Riwayat perubahan untuk argumen JVM YongGen .

AutoTuneFailed

Boolean yang menunjukkan jika perubahan Auto-Tune gagal.

AutoTuneSucceeded

Boolean yang menunjukkan apakah perubahan Auto-Tune berhasil.

AutoTuneValue Riwayat perubahan antrian (hitungan) dan riwayat perubahan penyetelan cache (di MiB) untuk perubahan yang tidak mengganggu.

Multi-AZ dengan metrik Siaga

Amazon OpenSearch Service menyediakan metrik berikut untuk Multi-AZ dengan Standby.

Metrik tingkat simpul untuk node data di Availability Zone aktif

Metrik Deskripsi
CPUUtilization Persentase penggunaan CPU untuk simpul data di klaster. Maksimum menunjukkan simpul dengan penggunaan CPU tertinggi. Rata-rata mewakili semua simpul dalam klaster. Metrik ini juga tersedia untuk masing-masing simpul.
FreeStorageSpace

Ruang kosong untuk simpul data dalam klaster. Sum menunjukkan total ruang kosong untuk klaster, tetapi Anda harus meninggalkan periode pada satu menit untuk mendapatkan nilai yang akurat. Minimum dan Maximum menunjukkan simpul dengan ruang paling sedikit dan paling bebas, menurut urutannya. Metrik ini juga tersedia untuk masing-masing node. OpenSearch Layanan melempar a ClusterBlockException saat metrik ini mencapai0. Untuk memulihkan, Anda harus menghapus indeks, menambahkan instance yang lebih besar, atau menambahkan penyimpanan berbasis EBS ke instance yang ada. Untuk mempelajari selengkapnya, lihat Kurangnya ruang penyimpanan yang tersedia.

Konsol OpenSearch Layanan menampilkan nilai ini di GiB. CloudWatch Konsol Amazon menampilkannya di MiB.

JVMMemoryPressure Persentase maksimum heap Java yang digunakan untuk semua node data di cluster. OpenSearch Layanan menggunakan setengah dari RAM instance untuk heap Java, hingga ukuran heap 32 GiB. Anda dapat menskalakan instans secara vertikal hingga 64 GiB RAM, di mana Anda dapat menskalakan secara horizontal dengan menambahkan instans. Lihat CloudWatch Alarm yang disarankan untuk Layanan Amazon OpenSearch .
SysMemoryUtilization Persentase memori instans yang sedang digunakan. Nilai tinggi untuk metrik ini normal dan biasanya tidak mewakili masalah dengan klaster Anda. Untuk indikator yang lebih baik mengenai potensi masalah performa dan stabilitas, lihat metrik JVMMemoryPressure.
IndexingLatency

Perbedaan total waktu, dalam milidetik, diambil oleh semua operasi pengindeksan dalam simpul antara menit N dan menit (N-1).

IndexingRate Jumlah operasi pengindeksan per menit.
SearchLatency

Perbedaan total waktu, dalam milidetik, diambil oleh semua pencarian dalam simpul antara menit N dan menit (N-1).

SearchRate Jumlah total permintaan pencarian per menit untuk semua serpihan pada simpul data.
ThreadpoolSearchQueue Jumlah antrean tugas di kolam utas pencarian. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda. Ukuran antrean pencarian maksimum adalah 1.000.
ThreadpoolWriteQueue Jumlah antrean tugas dalam kolam utas tulis.
ThreadpoolSearchRejected

Jumlah tugas yang ditolak dalam kolam utas pencarian. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda.

ThreadpoolWriteRejected Jumlah tugas yang ditolak dalam kolam utas tulis.

Metrik tingkat cluster untuk cluster di Availability Zone aktif

Metrik Deskripsi
DataNodes Jumlah total pecahan aktif dan siaga.
DataNodesShards.active Jumlah total aktif serpihan primer dan replika aktif.
DataNodesShards.unassigned

Jumlah serpihan yang tidak dialokasikan ke simpul di klaster.

DataNodesShards.initializing Jumlah serpihan yang berada di bawah inisialisasi.
DataNodesShards.relocating Jumlah serpihan yang berada di bawah relokasi.

Metrik rotasi Zona Ketersediaan

JikaActiveReads.Availability-Zone = 1, maka zona tersebut aktif. JikaActiveReads.Availability-Zone = 0, maka zona dalam keadaan siaga.

Metrik titik dalam waktu

Amazon OpenSearch Service menyediakan metrik berikut untuk pencarian point in time (PIT).

Statistik simpul koordinator PIT (per node koordinator)

Metrik Deskripsi
CurrentPointInTime Jumlah konteks pencarian PIT aktif di node.
TotalPointInTime Jumlah konteks pencarian PIT yang kedaluwarsa sejak node up time.
AvgPointInTimeAliveTime Rata-rata tetap hidup dari konteks pencarian PIT sejak node up time.
HasActivePointInTime Nilai 1 menunjukkan bahwa ada konteks PIT aktif pada node sejak waktu naik node. Nilai 0 berarti tidak ada.
HasUsedPointInTime Nilai 1 menunjukkan bahwa ada konteks PIT kedaluwarsa pada node sejak waktu habis node. Nilai 0 berarti tidak ada.

Metrik SQL

Amazon OpenSearch Service menyediakan metrik berikut untuk dukungan SQL.

Metrik Deskripsi
SQLFailedRequestCountByCusErr

Jumlah permintaan untuk API _sql yang gagal karena masalah klien. Sebagai contoh, permintaan mungkin mengembalikan kode status HTTP 400 karena IndexNotFoundException.

Statistik yang relevan: Jumlah

SQLFailedRequestCountBySysErr

Jumlah permintaan untuk API _sql yang gagal karena masalah server atau pembatasan fitur. Sebagai contoh, permintaan mungkin mengembalikan kode status HTTP 503 karena VerificationException.

Statistik yang relevan: Jumlah

SQLRequestCount

Jumlah permintaan untuk API _sql.

Statistik yang relevan: Jumlah

SQLDefaultCursorRequestCount

Mirip denganSQLRequestCount, tetapi hanya menghitung permintaan pagination.

Statistik yang relevan: Jumlah

SQLUnhealthy

Nilai 1 menunjukkan bahwa, dalam menanggapi permintaan tertentu, plugin SQL mengembalikan kode respons 5 xx atau meneruskan kueri DSL yang tidak valid ke. OpenSearch Permintaan lainnya harus terus berhasil. Nilai 0 menunjukkan tidak ada kegagalan baru-baru ini. Jika Anda melihat nilai berkelanjutan 1, pecahkan masalah permintaan yang klien Anda buat ke plugin.

Statistik yang relevan: Maksimum

metrik k-NN

Amazon OpenSearch Service menyertakan metrik berikut untuk plugin k-nearest neighbor (k-NN).

Metrik Deskripsi
KNNCacheCapacityReached

Metrik per simpul untuk melihat apakah kapasitas cache telah tercapai. Metrik ini hanya relevan dengan perkiraan pencarian k-NN.

Statistik yang relevan: Maksimum

KNNCircuitBreakerTriggered

Metrik per-klaster untuk melihat apakah pemutus sirkuit dipicu. Jika terdapat simpul yang mengembalikan nilai 1 untuk KNNCacheCapacityReached, nilai ini juga akan mengembalikan 1. Metrik ini hanya relevan dengan perkiraan pencarian k-NN.

Statistik yang relevan: Maksimum

KNNEvictionCount

Metrik per-simpul untuk sejumlah grafik yang telah dikosongkan dari cache karena kendala memori atau waktu siaga. Pengosongan eksplisit yang terjadi karena penghapusan indeks tidak diperhitungkan. Metrik ini hanya relevan dengan perkiraan pencarian k-NN.

Statistik yang relevan: Jumlah

KNNGraphIndexErrors

Metrik per simpul pada sejumlah permintaan untuk menambahkan knn_vector bidang dokumen ke grafik yang menghasilkan kesalahan.

Statistik yang relevan: Jumlah

KNNGraphIndexRequests

Metrik per simpul pada sejumlah permintaan untuk menambahkan knn_vector bidang dokumen ke grafik.

Statistik yang relevan: Jumlah

KNNGraphMemoryUsage

Metrik per simpul pada ukuran cache saat ini (ukuran total semua grafik dalam memori) dalam kilobyte. Metrik ini hanya relevan dengan perkiraan pencarian k-NN.

Statistik yang relevan: Rata-rata

KNNGraphQueryErrors

Metrik per simpul untuk sejumlah kueri grafik yang menghasilkan kesalahan.

Statistik yang relevan: Jumlah

KNNGraphQueryRequests

Metrik per simpul untuk sejumlah kueri grafik.

Statistik yang relevan: Jumlah

KNNHitCount

Metrik per simpul untuk sejumlah temuan cache. Sebuah temuan cache terjadi ketika pengguna mengajukan kueri grafik yang sudah dimuat ke dalam memori. Metrik ini hanya relevan dengan perkiraan pencarian k-NN.

Statistik yang relevan: Jumlah

KNNLoadExceptionCount

Metrik per simpul untuk beberapa kali pengecualian timbul ketika mencoba untuk memuat grafik ke dalam cache. Metrik ini hanya relevan dengan perkiraan pencarian k-NN.

Statistik yang relevan: Jumlah

KNNLoadSuccessCount

Metrik per simpul untuk frekuensi ketika plugin berhasil memuat grafik ke dalam cache. Metrik ini hanya relevan dengan perkiraan pencarian k-NN.

Statistik yang relevan: Jumlah

KNNMissCount

Metrik per simpul untuk sejumlah kelalaian cache. Kelalaian cache terjadi ketika pengguna mengajukan kueri grafik yang belum dimuat ke dalam memori. Metrik ini hanya relevan dengan perkiraan pencarian k-NN.

Statistik yang relevan: Jumlah

KNNQueryRequests

Metrik per simpul untuk sejumlah permintaan kueri yang diterima plugin k-NN.

Statistik yang relevan: Jumlah

KNNScriptCompilationErrors

Metrik per simpul untuk sejumlah kesalahan selama kompilasi penulisan. Statistik ini hanya relevan dengan pencarian penulisan skor k-NN.

Statistik yang relevan: Jumlah

KNNScriptCompilations

Metrik per simpul untuk frekuensi kompilasi penulisan k-NN. Nilai ini biasanya harus 1 atau 0, tetapi jika cache yang berisi kompilasi penulisan telah terisi, penulisan k-NN dapat dikompilasi ulang. Statistik ini hanya relevan dengan pencarian penulisan skor k-NN.

Statistik yang relevan: Jumlah

KNNScriptQueryErrors

Metrik per simpul untuk sejumlah kesalahan selama kueri penulisan. Statistik ini hanya relevan dengan pencarian penulisan skor k-NN.

Statistik yang relevan: Jumlah

KNNScriptQueryRequests

Metrik per simpul untuk sejumlah total kueri penulisan. Statistik ini hanya relevan dengan pencarian penulisan skor k-NN.

Statistik yang relevan: Jumlah

KNNTotalLoadTime

Waktu dalam nanodetik yang diperlukan k-NN untuk memuat grafik ke dalam cache. Metrik ini hanya relevan dengan perkiraan pencarian k-NN.

Statistik yang relevan: Jumlah

Amazon OpenSearch Service menyediakan metrik berikut untuk pencarian lintas klaster.

Metrik domain sumber

Metrik Dimensi Deskripsi
CrossClusterOutboundConnections

ConnectionId

Jumlah simpul yang terhubung. Jika respons Anda mencakup satu atau beberapa domain yang dilewati, gunakan metrik ini untuk melacak koneksi yang tidak sehat. Jika nomor ini turun menjadi 0, maka koneksi tidak sehat.

CrossClusterOutboundRequests

ConnectionId

Jumlah permintaan pencarian yang dikirim ke domain tujuan. Gunakan ini untuk memeriksa apakah beban permintaan pencarian lintas klaster membanjiri domain Anda, korelasikan lonjakan apa pun dalam metrik ini dengan lonjakan JVM/CPU.

Metrik domain tujuan

Metrik Dimensi Deskripsi
CrossClusterInboundRequests

ConnectionId

Jumlah permintaan koneksi masuk yang diterima dari domain sumber.

Tambahkan CloudWatch alarm jika Anda kehilangan koneksi secara tidak terduga. Untuk langkah-langkah membuat alarm, lihat Membuat CloudWatch Alarm Berdasarkan Ambang Statis.

Metrik replikasi lintas-cluster

Amazon OpenSearch Service menyediakan metrik berikut untuk replikasi lintas cluster.

Metrik Deskripsi
ReplicationRate

Tingkat rata-rata operasi replikasi per detik. Metrik ini mirip dengan IndexingRate metrik.

LeaderCheckPoint

Untuk koneksi tertentu, jumlah nilai pos pemeriksaan pemimpin di semua indeks yang mereplikasi. Anda dapat menggunakan metrik ini untuk mengukur latensi replikasi.

FollowerCheckPoint

Untuk koneksi tertentu, jumlah nilai pos pemeriksaan pengikut di semua indeks yang mereplikasi. Anda dapat menggunakan metrik ini untuk mengukur latensi replikasi.

ReplicationNumSyncingIndices

Jumlah indeks yang memiliki status replikasi. SYNCING

ReplicationNumBootstrappingIndices

Jumlah indeks yang memiliki status replikasi. BOOTSTRAPPING

ReplicationNumPausedIndices

Jumlah indeks yang memiliki status replikasi. PAUSED

ReplicationNumFailedIndices

Jumlah indeks yang memiliki status replikasi. FAILED

CrossClusterOutboundReplicationRequests

Jumlah permintaan transpor replikasi pada domain pengikut. Permintaan transportasi bersifat internal dan terjadi setiap kali operasi API replikasi dipanggil. Mereka juga terjadi ketika polling domain pengikut berubah dari domain pemimpin.

CrossClusterInboundReplicationRequests

Jumlah permintaan transpor replikasi pada domain pemimpin. Permintaan transportasi bersifat internal dan terjadi setiap kali operasi API replikasi dipanggil.

AutoFollowNumSuccessStartReplication

Jumlah indeks pengikut yang telah berhasil dibuat oleh aturan replikasi untuk koneksi tertentu.

AutoFollowNumFailedStartReplication

Jumlah indeks pengikut yang gagal dibuat oleh aturan replikasi ketika ada pola yang cocok. Masalah ini mungkin timbul karena masalah jaringan di cluster jarak jauh, atau masalah keamanan (yaitu peran terkait tidak memiliki izin untuk memulai replikasi).

AutoFollowLeaderCallFailure

Apakah ada kueri yang gagal dari indeks pengikut ke indeks pemimpin untuk menarik data baru. Nilai 1 berarti bahwa ada 1 atau lebih panggilan gagal di menit terakhir.

Metrik Learning to Rank

Amazon OpenSearch Service menyediakan metrik berikut untuk Belajar Peringkat.

Metrik Deskripsi
LTRRequestTotalCount

Jumlah total permintaan peringkat.

LTRRequestErrorCount

Jumlah total permintaan gagal.

LTRStatus.red

Melacak jika salah satu indeks yang diperlukan untuk menjalankan plugin berwarna merah.

LTRMemoryUsage

Total memori yang digunakan oleh plugin.

LTRFeatureMemoryUsageInBytes

Jumlah memori, dalam byte, yang digunakan oleh bidang fitur Learning to Rank.

LTRFeaturesetMemoryUsageInBytes

Jumlah memori, dalam byte, yang digunakan oleh seluruh set fitur Learning to Rank.

LTRModelMemoryUsageInBytes

Jumlah memori, dalam byte, yang digunakan oleh seluruh model Learning to Rank.

Metrik Bahasa Pemrosesan yang Disalurkan

Amazon OpenSearch Service menyediakan metrik berikut untuk Bahasa Pemrosesan Piped.

Metrik Deskripsi
PPLFailedRequestCountByCusErr

Jumlah permintaan untuk API _ppl yang gagal karena masalah klien. Sebagai contoh, permintaan mungkin mengembalikan kode status HTTP 400 karena IndexNotFoundException.

PPLFailedRequestCountBySysErr

Jumlah permintaan untuk API _ppl yang gagal karena masalah server atau pembatasan fitur. Sebagai contoh, permintaan mungkin mengembalikan kode status HTTP 503 karena VerificationException.

PPLRequestCount

Jumlah permintaan untuk API _ppl.