Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Memantau metrik OpenSearch klaster dengan Amazon CloudWatch
OpenSearch Layanan Amazon menerbitkan data dari domain Anda ke Amazon. CloudWatch CloudWatch memungkinkan Anda mengambil statistik tentang titik-titik data tersebut sebagai kumpulan data deret waktu yang diurutkan, yang dikenal sebagai metrik. OpenSearch Layanan mengirimkan sebagian besar metrik CloudWatch dalam interval 60 detik. Jika Anda menggunakan EBS Volume Tujuan Umum atau Magnetik, metrik EBS volume hanya diperbarui setiap lima menit. Semua metrik kumulatif (misalnyaThreadpoolWriteRejeceted
,ThreadpoolSearchRejected
) ada dalam memori dan akan kehilangan status. Metrik akan diatur ulang selama penurunan node, pantulan node, penggantian node, dan penerapan biru/hijau. Untuk informasi selengkapnya tentang Amazon CloudWatch, lihat Panduan CloudWatch Pengguna Amazon.
Konsol OpenSearch Layanan menampilkan serangkaian bagan berdasarkan data mentah dari CloudWatch. Bergantung pada kebutuhan Anda, Anda mungkin lebih suka melihat data cluster CloudWatch daripada grafik di konsol. Layanan mengarsipkan metrik selama dua minggu sebelum membuangnya. Metrik disediakan tanpa biaya tambahan, tetapi CloudWatch masih dikenakan biaya untuk membuat dasbor dan alarm. Untuk informasi selengkapnya, lihat CloudWatchharga Amazon
OpenSearch Layanan menerbitkan metrik berikut ke: CloudWatch
Melihat metrik di CloudWatch
CloudWatch metrik dikelompokkan terlebih dahulu oleh namespace layanan, dan kemudian oleh berbagai kombinasi dimensi dalam setiap namespace.
Untuk melihat metrik menggunakan konsol CloudWatch
-
Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/
. -
Di panel navigasi kiri, temukan Metrik dan pilih Semua metrik. Pilih ES/ OpenSearchService namespace.
-
Pilih dimensi untuk melihat metrik yang sesuai. Metrik untuk masing-masing simpul berada di dimensi
ClientId, DomainName, NodeId
. Metrik klaster ada di dimensiPer-Domain, Per-Client Metrics
. Beberapa metrik simpul dikumpulkan di tingkat klaster dan dengan demikian termasuk dalam kedua dimensi. Metrik serpihan berada di dimensiClientId, DomainName, NodeId, ShardRole
.
Untuk melihat daftar metrik menggunakan AWS CLI
Jalankan perintah berikut:
aws cloudwatch list-metrics --namespace "AWS/ES"
Menafsirkan grafik kesehatan dalam Layanan OpenSearch
Untuk melihat metrik di OpenSearch Layanan, gunakan tab kesehatan Cluster dan kesehatan Instance. Tab Instance health menggunakan bagan kotak untuk memberikan at-a-glance visibilitas ke kesehatan setiap OpenSearch node:
-
Setiap kotak berwarna menunjukkan rentang nilai untuk simpul selama periode waktu yang ditentukan.
-
Kotak biru mewakili nilai-nilai yang konsisten dengan simpul lainnya. Kotak merah mewakili outlier.
-
Garis putih dalam setiap kotak menunjukkan nilai simpul saat ini.
-
“Whisker” di kedua sisi setiap kotak menunjukkan nilai minimum dan maksimum untuk semua simpul selama periode waktu.
Jika Anda membuat perubahan konfigurasi ke domain Anda, daftar masing-masing instans di tab Kesehatan klaster dan Kesehatan instans sering kali berlipat ganda untuk jangka waktu singkat sebelum kembali ke nomor yang benar. Untuk penjelasan tentang perilaku ini, lihat Membuat perubahan konfigurasi di Amazon OpenSearch Service.
Metrik klaster
Amazon OpenSearch Service menyediakan metrik berikut untuk cluster.
Metrik | Deskripsi |
---|---|
HighSwapUsage |
Nilai 1 menunjukkan bahwa ada lonjakan dalam penggunaan disk atau sinyal pelambatan disk karena pertukaran. Statistik yang relevan: Maksimum |
ClusterStatus.green |
Nilai 1 menunjukkan bahwa semua serpihan indeks dialokasikan untuk simpul dalam klaster. Statistik yang relevan: Maksimum |
ClusterStatus.yellow |
Nilai 1 menunjukkan bahwa pecahan utama untuk semua indeks dialokasikan ke node di cluster, tetapi pecahan replika untuk setidaknya satu indeks tidak. Untuk informasi selengkapnya, lihat Status klaster kuning. Statistik yang relevan: Maksimum |
ClusterStatus.red |
Nilai 1 menunjukkan bahwa serpihan primer dan replika untuk setidaknya satu indeks tidak dialokasikan untuk simpul dalam klaster. Untuk informasi selengkapnya, lihat Status klaster merah. Statistik yang relevan: Maksimum |
Shards.active |
Jumlah total aktif serpihan primer dan replika aktif. Statistik yang relevan: Maksimum, Jumlah |
Shards.unassigned |
Jumlah serpihan yang tidak dialokasikan ke simpul di klaster. Statistik yang relevan: Maksimum, Jumlah |
Shards.delayedUnassigned |
Jumlah serpihan yang alokasi simpulnya telah tertunda oleh pengaturan batas waktu. Statistik yang relevan: Maksimum, Jumlah |
Shards.activePrimary |
Jumlah serpihan primer aktif. Statistik yang relevan: Maksimum, Jumlah |
Shards.initializing |
Jumlah serpihan yang berada di bawah inisialisasi. Statistik yang relevan: Jumlah |
Shards.relocating |
Jumlah serpihan yang berada di bawah relokasi. Statistik yang relevan: Jumlah |
Nodes |
Jumlah node di kluster OpenSearch Service, termasuk node master dan UltraWarm node khusus. Untuk informasi selengkapnya, lihat Membuat perubahan konfigurasi di Amazon OpenSearch Service. Statistik yang relevan: Maksimum |
SearchableDocuments |
Jumlah total dokumen yang dapat dicari di semua simpul data pada klaster. Statistik yang relevan: Minimum, Maksimum, Rata-rata |
DeletedDocuments |
Jumlah total dokumen yang ditandai untuk penghapusan di semua simpul data pada klaster. Dokumen-dokumen ini tidak lagi muncul di hasil pencarian, tetapi OpenSearch hanya menghapus dokumen yang dihapus dari disk selama penggabungan segmen. Metrik ini meningkat setelah permintaan hapus dan menurun setelah gabungan segmen. Statistik yang relevan: Minimum, Maksimum, Rata-rata |
CPUUtilization |
Persentase CPU penggunaan untuk node data dalam cluster. Maksimum menunjukkan node dengan CPU penggunaan tertinggi. Rata-rata mewakili semua simpul dalam klaster. Metrik ini juga tersedia untuk masing-masing simpul. Statistik yang relevan: Maksimum, Rata-rata |
FreeStorageSpace |
Ruang kosong untuk simpul data dalam klaster. Konsol OpenSearch Layanan menampilkan nilai ini di GiB. CloudWatch Konsol Amazon menampilkannya di MiB. catatan
Statistik yang relevan: Minimum, Maksimum, Rata-rata, Jumlah |
ClusterUsedSpace |
Total penggunaan ruang untuk klaster. Anda harus menyediakan periode pada satu menit untuk mendapatkan nilai yang akurat. Konsol OpenSearch Layanan menampilkan nilai ini di GiB. CloudWatch Konsol Amazon menampilkannya di MiB. Statistik yang relevan: Minimum, Maksimum |
ClusterIndexWritesBlocked |
Menunjukkan apakah klaster Anda menerima atau memblokir permintaan tulis yang masuk. Nilai 0 berarti klaster menerima permintaan. Nilai 1 berarti permintaan diblokir. Beberapa faktor umum mencakup hal berikut ini: Statistik yang relevan: Maksimum |
JVMMemoryPressure |
Persentase maksimum heap Java yang digunakan untuk semua node data di cluster. OpenSearch Layanan menggunakan setengah dari instance RAM untuk heap Java, hingga ukuran heap 32 GiB. Anda dapat menskalakan instance secara vertikal hingga 64 GiBRAM, di mana Anda dapat menskalakan secara horizontal dengan menambahkan instance. Lihat CloudWatch Alarm yang disarankan untuk Layanan Amazon OpenSearch . Statistik yang relevan: Maksimum catatanLogika untuk metrik ini berubah dalam perangkat lunak layanan R20220323. Untuk informasi selengkapnya, lihat catatan rilis. |
OldGenJVMMemoryPressure |
Persentase maksimum heap Java yang digunakan untuk “generasi lama” pada semua node data di cluster. Metrik ini juga tersedia di tingkat node. Statistik yang relevan: Maksimum |
AutomatedSnapshotFailure |
Jumlah snapshot otomatis yang gagal untuk klaster. Nilai Statistik yang relevan: Minimum, Maksimum |
CPUCreditBalance |
CPUKredit yang tersisa tersedia untuk node data di cluster. CPUKredit memberikan kinerja CPU inti penuh selama satu menit. Untuk informasi selengkapnya, lihat CPUkredit di Panduan EC2 Pengembang Amazon. Metrik ini hanya tersedia untuk tipe instans T2. Statistik yang relevan: Minimum |
OpenSearchDashboardsHealthyNodes |
Pemeriksaan kesehatan untuk OpenSearch Dasbor. Jika minimum, maksimum, dan rata-rata semuanya sama dengan 1, Dasbor berperilaku normal. Jika Anda memiliki 10 simpul dengan maksimum 1, minimal 0, dan rata-rata 0,7, ini berarti 7 simpul (70%) sehat dan 3 simpul (30%) tidak sehat. Statistik yang relevan: Minimum, Maksimum, Rata-rata |
OpensearchDashboardsReportingFailedRequestSysErrCount |
Jumlah permintaan untuk menghasilkan laporan OpenSearch Dasbor yang gagal karena masalah server atau keterbatasan fitur. Statistik yang relevan: Jumlah |
OpensearchDashboardsReportingFailedRequestUserErrCount |
Jumlah permintaan untuk menghasilkan laporan OpenSearch Dasbor yang gagal karena masalah klien. Statistik yang relevan: Jumlah |
OpensearchDashboardsReportingRequestCount |
Jumlah total permintaan untuk menghasilkan laporan OpenSearch Dasbor. Statistik yang relevan: Jumlah |
OpensearchDashboardsReportingSuccessCount |
Jumlah permintaan yang berhasil untuk menghasilkan laporan OpenSearch Dasbor. Statistik yang relevan: Jumlah |
KMSKeyError |
Nilai 1 menunjukkan bahwa AWS KMS kunci yang digunakan untuk mengenkripsi data saat istirahat telah dinonaktifkan. Untuk memulihkan domain untuk operasi normal, aktifkan kembali kunci. Konsol menampilkan metrik ini hanya untuk domain yang mengenkripsi data tidak aktif. Statistik yang relevan: Minimum, Maksimum |
KMSKeyInaccessible |
Nilai 1 menunjukkan bahwa AWS KMS kunci yang digunakan untuk mengenkripsi data saat istirahat telah dihapus atau dicabut hibahnya ke Layanan. OpenSearch Anda tidak dapat memulihkan domain yang berada dalam keadaan ini. Jika Anda memiliki snapshot manual, Anda dapat menggunakannya untuk memigrasi data domain ke domain baru. Konsol menampilkan metrik ini hanya untuk domain yang mengenkripsi data tidak aktif. Statistik yang relevan: Minimum, Maksimum |
InvalidHostHeaderRequests |
Jumlah HTTP permintaan yang dibuat ke OpenSearch cluster yang menyertakan header host yang tidak valid (atau hilang). Permintaan yang valid menyertakan nama host domain sebagai nilai header host. OpenSearch Layanan menolak permintaan yang tidak valid untuk domain akses publik yang tidak memiliki kebijakan akses terbatas. Anda sebaiknya menerapkan kebijakan akses terbatas ke semua domain. Jika Anda melihat nilai besar untuk metrik ini, konfirmasikan bahwa OpenSearch klien Anda menyertakan nama host domain (dan bukan, misalnya, alamat IP-nya) dalam permintaan mereka. Statistik yang relevan: Jumlah |
OpenSearchRequests (previously
ElasticsearchRequests) |
Jumlah permintaan yang dibuat ke OpenSearch cluster. Statistik yang relevan: Jumlah |
2xx, 3xx, 4xx, 5xx |
Jumlah permintaan ke domain yang menghasilkan kode HTTP respons yang diberikan (2 xx, 3 xx, 4 xx, 5 xx). Statistik yang relevan: Jumlah |
ThroughputThrottle |
Menunjukkan apakah disk telah dibatasi atau tidak. Throttling terjadi ketika throughput gabungan Untuk informasi tentang throughput instans, lihat Instans yang EBSdioptimalkan Amazon. Untuk informasi tentang throughput volume, lihat Jenis EBS volume Amazon Statistik yang relevan: Minimum, Maksimum |
IopsThrottle |
Menunjukkan apakah jumlah operasi input/output per detik (IOPS) pada domain telah dibatasi atau tidak. Throttling terjadi ketika IOPS node data melanggar batas maksimum yang diizinkan dari EBS volume atau EC2 instance dari node data. Untuk informasi tentang instanceIOPS, lihat Instans yang EBS dioptimalkan Amazon. Untuk informasi tentang volumeIOPS, lihat Jenis EBS volume Amazon Statistik yang relevan: Minimum, Maksimum |
Metrik simpul utama khusus
Amazon OpenSearch Service menyediakan metrik berikut untuk node master khusus.
Metrik | Deskripsi |
---|---|
MasterCPUUtilization |
Persentase maksimum CPU sumber daya yang digunakan oleh node master khusus. Sebaiknya tingkatkan ukuran tipe instans saat metrik ini mencapai 60 persen. Statistik yang relevan: Maksimum |
MasterFreeStorageSpace |
Metrik ini tidak relevan dan bisa diabaikan. Layanan tidak menggunakan simpul utama sebagai data simpul. |
MasterJVMMemoryPressure |
Persentase maksimum tumpukan Java yang digunakan untuk semua simpul utama khusus di klaster. Sebaiknya lakukan pemindahan ke tipe instans yang lebih besar bila metrik ini mencapai 85 persen. Statistik yang relevan: Maksimum catatanLogika untuk metrik ini berubah dalam perangkat lunak layanan R20220323. Untuk informasi selengkapnya, lihat catatan rilis. |
MasterOldGenJVMMemoryPressure |
Persentase maksimum heap Java yang digunakan untuk “generasi lama” per master node. Statistik yang relevan: Maksimum |
MasterCPUCreditBalance |
CPUKredit yang tersisa tersedia untuk node master khusus di cluster. CPUKredit memberikan kinerja CPU inti penuh selama satu menit. Untuk informasi selengkapnya, lihat CPUkredit di Panduan EC2 Pengembang Amazon. Metrik ini hanya tersedia untuk tipe instans T2. Statistik yang relevan: Minimum |
MasterReachableFromNode |
Pemeriksaan kondisi untuk pengecualian Kegagalan berarti bahwa node master tidak dapat dijangkau dari node sumber. Mereka biasanya hasil dari masalah konektivitas jaringan atau masalah AWS ketergantungan. Statistik yang relevan: Maksimum |
MasterSysMemoryUtilization |
Persentase memori simpul utama yang sedang digunakan. Statistik yang relevan: Maksimum |
EBSmetrik volume
Amazon OpenSearch Service menyediakan metrik berikut untuk EBS volume.
Metrik | Deskripsi |
---|---|
ReadLatency |
Latensi, dalam hitungan detik, untuk operasi baca pada EBS volume. Metrik ini juga tersedia untuk masing-masing simpul. Statistik yang relevan: Minimum, Maksimum, Rata-rata |
WriteLatency |
Latensi, dalam hitungan detik, untuk operasi tulis pada EBS volume. Metrik ini juga tersedia untuk masing-masing simpul. Statistik yang relevan: Minimum, Maksimum, Rata-rata |
ReadThroughput |
Throughput, dalam byte per detik, untuk operasi baca pada EBS volume. Metrik ini juga tersedia untuk masing-masing simpul. Statistik yang relevan: Minimum, Maksimum, Rata-rata |
ReadThroughputMicroBursting |
Throughput, dalam byte per detik, untuk operasi baca pada EBS volume saat ledakan mikro dipertimbangkan Statistik yang relevan: Minimum, Maksimum, Rata-rata |
WriteThroughput |
Throughput, dalam byte per detik, untuk operasi tulis pada EBS volume. Metrik ini juga tersedia untuk masing-masing simpul. Statistik yang relevan: Minimum, Maksimum, Rata-rata |
WriteThroughputMicroBursting |
Throughput, dalam byte per detik, untuk operasi tulis pada EBS volume ketika micro-bursting dipertimbangkan Statistik yang relevan: Minimum, Maksimum, Rata-rata |
DiskQueueDepth |
Jumlah permintaan input dan output (I/O) yang tertunda untuk EBS volume. Statistik yang relevan: Minimum, Maksimum, Rata-rata |
ReadIOPS |
Jumlah operasi input dan output (I/O) per detik untuk operasi baca pada EBS volume. Metrik ini juga tersedia untuk masing-masing simpul. Statistik yang relevan: Minimum, Maksimum, Rata-rata |
ReadIOPSMicroBursting |
Jumlah operasi input dan output (I/O) per detik untuk operasi baca pada EBS volume ketika micro-bursting dipertimbangkan Statistik yang relevan: Minimum, Maksimum, Rata-rata |
WriteIOPS |
Jumlah operasi input dan output (I/O) per detik untuk operasi tulis pada EBS volume. Metrik ini juga tersedia untuk masing-masing simpul. Statistik yang relevan: Minimum, Maksimum, Rata-rata |
WriteIOPSMicroBursting |
Jumlah operasi input dan output (I/O) per detik untuk operasi tulis pada EBS volume ketika micro-bursting dipertimbangkan Statistik yang relevan: Minimum, Maksimum, Rata-rata |
BurstBalance |
Persentase kredit input dan output (I/O) yang tersisa di bucket burst untuk sebuah EBS volume. Nilai 100 berarti bahwa volume telah mengumpulkan jumlah kredit maksimum. Jika persentase ini turun di bawah 70%, lihatKeseimbangan burst EBS rendah. Saldo burst tetap pada 0 untuk domain dengan tipe volume gp3, dan domain dengan volume gp2 yang memiliki ukuran volume di atas 1000 GiB. Statistik yang relevan: Minimum, Maksimum, Rata-rata |
Metrik instans
Amazon OpenSearch Service menyediakan metrik berikut untuk setiap instans dalam domain. OpenSearch Layanan juga menggabungkan metrik instans ini untuk memberikan wawasan tentang kesehatan klaster secara keseluruhan. Anda dapat memverifikasi perilaku ini dengan menggunakan statistik Jumlah Sampel dalam konsol. Perhatikan bahwa setiap metrik dalam tabel berikut memiliki statistik yang relevan untuk simpul dan klaster.
penting
Versi Elasticsearch yang berbeda menggunakan kumpulan utas yang berbeda untuk memproses panggilan ke file. _index
API Elasticsearch 1.5 dan 2.3 menggunakan kolam utas indeks. Elasticsearch 5. x, 6.0, dan 6.2 menggunakan kumpulan utas massal. OpenSearch dan Elasticsearch 6.3 dan yang lebih baru gunakan kumpulan utas tulis. Saat ini, konsol OpenSearch Layanan tidak menyertakan grafik untuk kumpulan utas massal.
Gunakan GET _cluster/settings?include_defaults=true
untuk memeriksa kolam utas dan ukuran antrean untuk klaster Anda.
Metrik | Deskripsi |
---|---|
ConcurrentSearchRate |
Jumlah total permintaan pencarian menggunakan pencarian segmen bersamaan per menit untuk semua pecahan pada node data. Satu panggilan ke Statistik simpul yang relevan: Rata-rata Statistik klaster yang relevan: Rata-rata, Maksimum, Sum |
ConcurrentSearchLatency |
Perbedaan total waktu, dalam milidetik, diambil oleh semua pencarian menggunakan pencarian segmen bersamaan dalam simpul antara menit N dan menit (N-1). Statistik simpul yang relevan: Rata-rata Statistik klaster yang relevan: Rata-rata, Maksimum |
IndexingLatency |
Perbedaan total waktu, dalam milidetik, diambil oleh semua operasi pengindeksan dalam simpul antara menit N dan menit (N-1). Statistik simpul yang relevan: Rata-rata Statistik klaster yang relevan: Rata-rata, Maksimum |
IndexingRate |
Jumlah operasi pengindeksan per menit. Satu panggilan ke Statistik simpul yang relevan: Rata-rata Statistik klaster yang relevan: Rata-rata, Maksimum, Sum |
SearchLatency |
Perbedaan total waktu, dalam milidetik, diambil oleh semua pencarian dalam simpul antara menit N dan menit (N-1). Statistik simpul yang relevan: Rata-rata Statistik klaster yang relevan: Rata-rata, Maksimum |
SearchRate |
Jumlah total permintaan pencarian per menit untuk semua serpihan pada simpul data. Satu panggilan ke Statistik simpul yang relevan: Rata-rata Statistik klaster yang relevan: Rata-rata, Maksimum, Sum |
SegmentCount |
Jumlah segmen pada simpul data. Semakin banyak segmen yang Anda miliki, semakin lama setiap pencarian berlangsung. OpenSearch kadang-kadang menggabungkan segmen yang lebih kecil menjadi yang lebih besar. Statistik simpul yang relevan: Maksimum, Rata-rata Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
SysMemoryUtilization |
Persentase memori instans yang sedang digunakan. Nilai tinggi untuk metrik ini normal dan biasanya tidak mewakili masalah dengan klaster Anda. Untuk indikator yang lebih baik mengenai potensi masalah performa dan stabilitas, lihat metrik Statistik simpul yang relevan: Minimum, Maksimum, Rata-rata Statistik klaster yang relevan: Minimum, Maksimum, Rata-rata |
JVMGCYoungCollectionCount |
Frekuensi pengumpulan sampah "generasi muda" telah berjalan. Jumlah eksekusi yang besar dan terus bertambah adalah bagian normal dari operasi klaster. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
JVMGCYoungCollectionTime |
Jumlah waktu, dalam milidetik, yang telah klaster habiskan untuk melakukan pengumpulan sampah "generasi muda". Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
JVMGCOldCollectionCount |
Frekuensi pengumpulan sampah "generasi tua" telah berjalan. Dalam sebuah klaster dengan sumber daya yang cukup, jumlah ini harus tetap kecil dan jarang bertumbuh. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
JVMGCOldCollectionTime |
Jumlah waktu, dalam milidetik, yang telah klaster habiskan untuk melakukan pengumpulan sampah "generasi tua". Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
OpenSearchDashboardsConcurrentConnections |
Jumlah koneksi konkuren aktif ke OpenSearch Dasbor. Jika nomor ini selalu tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
OpenSearchDashboardsHealthyNode |
Pemeriksaan kesehatan untuk node OpenSearch Dasbor individu. Nilai 1 menunjukkan perilaku normal. Nilai 0 menunjukkan bahwa Dasbor tidak dapat diakses. Statistik simpul yang relevan: Minimum Statistik klaster yang relevan: Minimum, Maksimum, Rata-rata |
OpenSearchDashboardsHeapTotal |
Jumlah memori heap yang dialokasikan ke OpenSearch Dasbor di MiB. Jenis EC2 instance yang berbeda dapat memengaruhi alokasi memori yang tepat. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
OpenSearchDashboardsHeapUsed |
Jumlah absolut memori heap yang digunakan oleh OpenSearch Dasbor di MiB. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
OpenSearchDashboardsHeapUtilization |
Persentase maksimum memori heap yang tersedia yang digunakan oleh OpenSearch Dasbor. Jika nilai ini meningkat di atas 80%, pertimbangkan untuk menyesuaikan skala klaster Anda. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Minimum, Maksimum, Rata-rata |
OpenSearchDashboardsOS1MinuteLoad |
Rata-rata CPU beban satu menit untuk OpenSearch Dasbor. CPUBeban idealnya harus tetap di bawah 1,00. Meskipun lonjakan sementara tidak masalah, Anda sebaiknya meningkatkan ukuran tipe instans jika metrik ini terus di atas 1.00. Statistik simpul yang relevan: Rata-rata Statistik klaster yang relevan: Rata-rata, Maksimum |
OpenSearchDashboardsRequestTotal |
Jumlah total HTTP permintaan yang dibuat ke OpenSearch Dasbor. Jika sistem Anda lambat atau Anda melihat jumlah permintaan Dasbor yang tinggi, pertimbangkan untuk meningkatkan ukuran jenis instans. Statistik simpul yang relevan: Jumlah Statistik klaster yang relevan: Jumlah |
OpenSearchDashboardsResponseTimesMaxInMillis |
Jumlah waktu maksimum, dalam milidetik, yang dibutuhkan OpenSearch Dasbor untuk menanggapi permintaan. Jika permintaan terus memakan waktu lama untuk mengembalikan hasilnya, pertimbangkan untuk meningkatkan ukuran tipe instans. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Maksimum, Rata-rata |
SearchTaskCancelled |
Jumlah pembatalan node koordinator. Statistik simpul yang relevan: Jumlah Statistik klaster yang relevan: Jumlah |
SearchShardTaskCancelled |
Jumlah pembatalan node data. Statistik simpul yang relevan: Jumlah Statistik cluster yang relevan: Jumlah, |
ThreadpoolForce_mergeQueue |
Jumlah antrean tugas dalam kolam utas gabungan daya. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
ThreadpoolForce_mergeRejected |
Jumlah tugas yang ditolak dalam kolam utas gabungan daya. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah |
ThreadpoolForce_mergeThreads |
Ukuran kolam utas gabungan daya. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Sum |
ThreadpoolIndexQueue |
Jumlah antrean tugas dalam kolam utas indeks. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda. Ukuran antrean indeks maksimum adalah 200. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
ThreadpoolIndexRejected |
Jumlah tugas yang ditolak dalam kolam utas indeks. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah |
ThreadpoolIndexThreads |
Ukuran kolam utas indeks. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Jumlah |
ThreadpoolSearchQueue |
Jumlah antrean tugas di kolam utas pencarian. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda. Ukuran antrean pencarian maksimum adalah 1.000. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
ThreadpoolSearchRejected |
Jumlah tugas yang ditolak dalam kolam utas pencarian. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah |
ThreadpoolSearchThreads |
Ukuran kolam utas pencarian. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Sum |
Threadpoolsql-workerQueue |
Jumlah tugas antrian di kumpulan utas SQL pencarian. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
Threadpoolsql-workerRejected |
Jumlah tugas yang ditolak di kumpulan thread SQL pencarian. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah |
Threadpoolsql-workerThreads |
Ukuran kumpulan utas SQL pencarian. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Jumlah |
ThreadpoolBulkQueue |
Jumlah antrean tugas dalam kolam utas massal. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
ThreadpoolBulkRejected |
Jumlah tugas yang ditolak dalam kolam utas massal. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah |
ThreadpoolBulkThreads |
Ukuran kolam utas massal. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Sum |
ThreadpoolIndexSearcherQueue |
Jumlah tugas antrian di kumpulan thread pencari indeks. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
ThreadpoolIndexSearcherRejected |
Jumlah tugas yang ditolak di kumpulan thread pencari indeks. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah |
ThreadpoolIndexSearcherThreads |
Ukuran kumpulan thread pencari indeks. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Jumlah |
ThreadpoolWriteThreads |
Ukuran kolam utas tulis. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Jumlah |
ThreadpoolWriteQueue |
Jumlah antrean tugas dalam kolam utas tulis. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Jumlah |
ThreadpoolWriteRejected |
Jumlah tugas yang ditolak dalam kolam utas tulis. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Sum catatanKarena ukuran antrian tulis default ditingkatkan dari 200 menjadi 10000 di versi 7.1, metrik ini bukan lagi satu-satunya indikator penolakan dari Layanan. OpenSearch Gunakan |
CoordinatingWriteRejected |
Jumlah total penolakan terjadi pada node koordinasi karena tekanan pengindeksan sejak startup proses OpenSearch Service terakhir. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Sum Metrik ini tersedia dalam versi 7.1 ke atas. |
PrimaryWriteRejected |
Jumlah total penolakan terjadi pada pecahan primer karena tekanan pengindeksan sejak startup proses OpenSearch Layanan terakhir. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Sum Metrik ini tersedia dalam versi 7.1 ke atas. |
ReplicaWriteRejected |
Jumlah total penolakan terjadi pada pecahan replika karena tekanan pengindeksan sejak proses Layanan terakhir OpenSearch dimulai. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Sum Metrik ini tersedia dalam versi 7.1 ke atas. |
UltraWarm metrik
Amazon OpenSearch Service menyediakan metrik berikut untuk UltraWarmnode.
Metrik | Deskripsi |
---|---|
WarmCPUUtilization |
Persentase CPU penggunaan untuk UltraWarm node di cluster. Maksimum menunjukkan node dengan CPU penggunaan tertinggi. Rata-rata mewakili semua UltraWarm node dalam cluster. Metrik ini juga tersedia untuk masing-masing UltraWarm node. Statistik yang relevan: Maksimum, Rata-rata |
WarmFreeStorageSpace |
Jumlah ruang penyimpanan hangat bebas di MiB. Karena UltraWarm menggunakan Amazon S3 daripada disk terlampir, Statistik yang relevan: Jumlah |
WarmSearchableDocuments |
Jumlah total dokumen yang dapat dicari di semua indeks hangat di cluster. Anda harus menyediakan periode pada satu menit untuk mendapatkan nilai yang akurat. Statistik yang relevan: Jumlah |
WarmSearchLatency
|
Perbedaan total waktu, dalam milidetik, diambil oleh semua pencarian di UltraWarm antara menit N dan menit (N-1). Statistik simpul yang relevan: Rata-rata Statistik klaster yang relevan: Rata-rata, Maksimum |
WarmSearchRate
|
Jumlah total permintaan pencarian per menit untuk semua pecahan pada sebuah UltraWarm node. Satu panggilan ke Statistik simpul yang relevan: Rata-rata Statistik klaster yang relevan: Rata-rata, Maksimum, Jumlah |
WarmStorageSpaceUtilization |
Jumlah total ruang penyimpanan hangat, di MiB, yang digunakan klaster. Statistik yang relevan: Maksimum |
HotStorageSpaceUtilization
|
Jumlah total ruang penyimpanan panas yang digunakan klaster. Statistik yang relevan: Maksimum |
WarmSysMemoryUtilization |
Persentase memori simpul hangat yang sedang digunakan. Statistik yang relevan: Maksimum |
HotToWarmMigrationQueueSize
|
Jumlah indeks yang saat ini menunggu untuk bermigrasi dari penyimpanan panas ke penyimpanan hangat. Statistik yang relevan: Maksimum |
WarmToHotMigrationQueueSize
|
Jumlah indeks yang saat ini menunggu untuk bermigrasi dari penyimpanan hangat ke penyimpanan panas. Statistik yang relevan: Maksimum |
HotToWarmMigrationFailureCount
|
Jumlah total migrasi panas ke hangat yang gagal. Statistik yang relevan: Jumlah |
HotToWarmMigrationForceMergeLatency
|
Latensi rata-rata tahap gabungan daya dari proses migrasi. Jika tahap ini secara konsisten memakan waktu terlalu lama, pertimbangkan untuk meningkatkan Statistik yang relevan: Rata-rata |
HotToWarmMigrationSnapshotLatency
|
Latensi rata-rata tahap snapshot dari proses migrasi. Jika tahap ini secara konsisten memakan waktu terlalu lama, pastikan bahwa serpihan Anda tepat ukuran dan didistribusikan di seluruh klaster. Statistik yang relevan: Rata-rata |
HotToWarmMigrationProcessingLatency
|
Latensi rata-rata pada migrasi panas ke hangat yang sukses, tidak termasuk waktu yang dihabiskan dalam antrean. Nilai ini adalah jumlah dari seluruh waktu yang dibutuhkan untuk menyelesaikan gabungan daya, snapshot, dan tahap relokasi serpihan dari proses migrasi. Statistik yang relevan: Rata-rata |
HotToWarmMigrationSuccessCount
|
Jumlah total migrasi panas ke hangat yang berhasil. Statistik yang relevan: Jumlah |
HotToWarmMigrationSuccessLatency
|
Latensi rata-rata pada migrasi panas ke hangat yang sukses, termasuk waktu yang dihabiskan dalam antrean. Statistik yang relevan: Rata-rata |
WarmThreadpoolSearchThreads |
Ukuran kumpulan utas UltraWarm pencarian. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Rata-rata, Sum |
WarmThreadpoolSearchRejected |
Jumlah tugas yang ditolak di kumpulan thread UltraWarm pencarian. Jika angka ini terus bertambah, pertimbangkan untuk menambahkan lebih banyak UltraWarm node. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah |
WarmThreadpoolSearchQueue |
Jumlah tugas antrian di kumpulan utas UltraWarm pencarian. Jika ukuran antrian tinggi secara konsisten, pertimbangkan untuk menambahkan lebih banyak UltraWarm node. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
WarmJVMMemoryPressure |
Persentase maksimum heap Java yang digunakan untuk UltraWarm node. Statistik yang relevan: Maksimum catatanLogika untuk metrik ini berubah dalam perangkat lunak layanan R20220323. Untuk informasi selengkapnya, lihat catatan rilis. |
WarmOldGenJVMMemoryPressure |
Persentase maksimum heap Java yang digunakan untuk “generasi lama” per UltraWarm node. Statistik yang relevan: Maksimum |
WarmJVMGCYoungCollectionCount |
Berapa kali pengumpulan sampah “generasi muda” berjalan di UltraWarm node. Jumlah eksekusi yang besar dan terus bertambah adalah bagian normal dari operasi klaster. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
WarmJVMGCYoungCollectionTime |
Jumlah waktu, dalam milidetik, yang dihabiskan cluster untuk melakukan pengumpulan sampah “generasi muda” di UltraWarm node. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
WarmJVMGCOldCollectionCount |
Berapa kali pengumpulan sampah “generasi lama” berjalan di UltraWarm node. Dalam sebuah klaster dengan sumber daya yang cukup, jumlah ini harus tetap kecil dan jarang bertumbuh. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
WarmConcurrentSearchRate |
Jumlah total permintaan pencarian menggunakan pencarian segmen bersamaan per menit untuk semua pecahan pada node. UltraWarm Satu panggilan ke Statistik simpul yang relevan: Rata-rata Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
WarmConcurrentSearchLatency |
Perbedaan total waktu, dalam milidetik, diambil oleh semua pencarian menggunakan pencarian segmen bersamaan dalam UltraWarm simpul antara menit N dan menit (N-1). Statistik simpul yang relevan: Rata-rata Statistik klaster yang relevan: Maksimum, Rata-rata |
WarmThreadpoolIndexSearcherQueue |
Jumlah tugas antrian di kumpulan thread pencari UltraWarm indeks. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah, Maksimum, Rata-rata |
WarmThreadpoolIndexSearcherRejected |
Jumlah tugas yang ditolak di kumpulan thread pencari UltraWarm indeks. Statistik simpul yang relevan: Maksimum Statistik klaster yang relevan: Jumlah |
WarmThreadpoolIndexSearcherThreads |
Ukuran kumpulan thread pencari UltraWarm indeks. Statistik simpul yang relevan: Maksimum Statistik cluster yang relevan: Jumlah, Rata-rata |
Metrik penyimpanan dingin
Amazon OpenSearch Service menyediakan metrik berikut untuk penyimpanan dingin.
Metrik | Deskripsi |
---|---|
ColdStorageSpaceUtilization
|
Jumlah total ruang penyimpanan dingin, di MiB, yang digunakan klaster. Statistik yang relevan: Maks |
ColdToWarmMigrationFailureCount |
Jumlah total migrasi dingin ke hangat yang gagal. Statistik yang relevan: Jumlah |
ColdToWarmMigrationLatency |
Jumlah waktu yang diperlukan untuk berhasil menyelesaikan migrasi dingin ke hangat. Statistik yang relevan: Rata-rata |
ColdToWarmMigrationQueueSize |
Jumlah indeks yang saat ini menunggu untuk bermigrasi dari penyimpanan dingin ke penyimpanan hangat. Statistik yang relevan: Maksimum |
ColdToWarmMigrationSuccessCount
|
Jumlah total migrasi dingin ke hangat yang berhasil. Statistik yang relevan: Jumlah |
WarmToColdMigrationFailureCount
|
Jumlah total migrasi hangat ke dingin yang gagal. Statistik yang relevan: Jumlah |
WarmToColdMigrationLatency |
Jumlah waktu yang diperlukan untuk berhasil menyelesaikan migrasi hangat ke dingin. Statistik yang relevan: Rata-rata |
WarmToColdMigrationQueueSize |
Jumlah indeks yang saat ini menunggu untuk bermigrasi dari penyimpanan hangat ke penyimpanan dingin. Statistik yang relevan: Maksimum |
WarmToColdMigrationSuccessCount |
Jumlah total migrasi hangat ke dingin yang berhasil. Statistik yang relevan: Jumlah |
OR1metrik
Amazon OpenSearch Service menyediakan metrik berikut untuk OR1instans.
Metrik | Deskripsi |
---|---|
RemoteStorageUsedSpace
|
Jumlah total ruang Amazon S3, di MiB, yang digunakan cluster. Statistik yang relevan: Jumlah |
RemoteStorageWriteRejected |
Jumlah total permintaan yang ditolak pada pecahan primer karena penyimpanan jarak jauh dan tekanan replikasi. Ini dihitung mulai dari startup proses OpenSearch Layanan terakhir. Statistik yang relevan: Jumlah |
ReplicationLagMaxTime |
Jumlah waktu, dalam milidetik, pecahan replika berada di belakang pecahan utama. Statistik yang relevan: Maksimum |
Metrik pemberitahuan
Amazon OpenSearch Service menyediakan metrik berikut untuk peringatan.
Metrik | Deskripsi |
---|---|
AlertingDegraded |
Nilai 1 berarti indeks pemberitahuan berwarna merah atau satu atau beberapa simpul tidak sesuai jadwal. Nilai 0 menunjukkan perilaku normal. Statistik yang relevan: Maksimum |
AlertingIndexExists |
Nilai 1 berarti indeks Statistik yang relevan: Maksimum |
AlertingIndexStatus.green |
Kesehatan indeks. Nilai 1 berarti hijau. Nilai 0 berarti indeks tidak tersedia atau tidak hijau. Statistik yang relevan: Maksimum |
AlertingIndexStatus.red |
Kesehatan indeks. Nilai 1 berarti merah. Nilai 0 berarti indeks tidak tersedia atau tidak merah. Statistik yang relevan: Maksimum |
AlertingIndexStatus.yellow |
Kesehatan indeks. Nilai 1 berarti kuning. Nilai 0 berarti indeks tidak tersedia atau tidak kuning. Statistik yang relevan: Maksimum |
AlertingNodesNotOnSchedule |
Nilai 1 berarti beberapa tugas tidak berjalan sesuai jadwal. Nilai 0 berarti semua tugas pemberitahuan berjalan sesuai jadwal (atau bahwa tidak terdapat tugas pemberitahuan). Periksa konsol OpenSearch Layanan atau buat Statistik yang relevan: Maksimum |
AlertingNodesOnSchedule |
Nilai 1 berarti semua tugas pemberitahuan berjalan sesuai jadwal (atau bahwa tidak terdapat tugas pemberitahuan). Nilai 0 berarti beberapa tugas tidak berjalan sesuai jadwal. Statistik yang relevan: Maksimum |
AlertingScheduledJobEnabled |
Nilai 1 berarti Pengaturan klaster Statistik yang relevan: Maksimum |
Metrik deteksi anomali
Amazon OpenSearch Service menyediakan metrik berikut untuk deteksi anomali.
Metrik | Deskripsi |
---|---|
ADPluginUnhealthy |
Nilai 1 berarti bahwa plugin deteksi anomali tidak berfungsi dengan baik, baik karena jumlah kegagalan yang tinggi atau karena salah satu indeks yang digunakannya berwarna merah. Nilai 0 menunjukkan plugin bekerja seperti yang diharapkan. Statistik yang relevan: Maksimum |
ADExecuteRequestCount |
Jumlah permintaan untuk mendeteksi anomali. Statistik yang relevan: Jumlah |
ADExecuteFailureCount
|
Jumlah permintaan gagal untuk mendeteksi anomali. Statistik yang relevan: Jumlah |
ADHCExecuteFailureCount |
Jumlah permintaan gagal untuk mendeteksi anomali pada detektor kardinalitas tinggi. Statistik yang relevan: Jumlah |
ADHCExecuteRequestCount |
Jumlah permintaan untuk mendeteksi anomali pada detektor kardinalitas tinggi. Statistik yang relevan: Jumlah |
ADAnomalyResultsIndexStatusIndexExists |
Nilai 1 berarti indeks yang menurut alias Statistik yang relevan: Maksimum |
ADAnomalyResultsIndexStatus.red |
Nilai 1 berarti indeks yang menurut alias Statistik yang relevan: Maksimum |
ADAnomalyDetectorsIndexStatusIndexExists |
Nilai 1 berarti indeks Statistik yang relevan: Maksimum |
ADAnomalyDetectorsIndexStatus.red |
Nilai 1 berarti indeks Statistik yang relevan: Maksimum |
ADModelsCheckpointIndexStatusIndexExists |
Nilai 1 berarti indeks Statistik yang relevan: Maksimum |
ADModelsCheckpointIndexStatus.red |
Nilai 1 berarti indeks Statistik yang relevan: Maksimum |
Metrik pencarian asinkron
Amazon OpenSearch Service menyediakan metrik berikut untuk penelusuran asinkron.
Statistik simpul koordinator pencarian asinkron (per node koordinator)
Metrik | Deskripsi |
---|---|
AsynchronousSearchSubmissionRate |
Jumlah pencarian asinkron yang dikirimkan di menit terakhir. |
AsynchronousSearchInitializedRate |
Jumlah pencarian asinkron yang diinisialisasi di menit terakhir. |
AsynchronousSearchRunningCurrent |
Jumlah pencarian asinkron yang saat ini berjalan. |
AsynchronousSearchCompletionRate |
Jumlah pencarian asinkron yang berhasil diselesaikan di menit terakhir. |
AsynchronousSearchFailureRate |
Jumlah pencarian asinkron yang diselesaikan dan gagal di menit terakhir. |
AsynchronousSearchPersistRate |
Jumlah pencarian asinkron yang bertahan di menit terakhir. |
AsynchronousSearchPersistFailedRate |
Jumlah pencarian asinkron yang tidak bertahan di menit terakhir. |
AsynchronousSearchRejected |
Jumlah total pencarian asinkron yang ditolak sejak waktu aktif simpul. |
AsynchronousSearchCancelled |
Jumlah total pencarian asinkron yang dibatalkan sejak waktu aktif simpul. |
AsynchronousSearchMaxRunningTime |
Durasi pencarian asinkron terpanjang berjalan pada simpul di menit terakhir. |
Statistik klaster pencarian asinkron
Metrik | Deskripsi |
---|---|
AsynchronousSearchStoreHealth |
Kesehatan toko dalam indeks bertahan (RED/non-RED) di menit terakhir. |
AsynchronousSearchStoreSize |
Ukuran indeks sistem pada semua serpihan di menit terakhir. |
AsynchronousSearchStoredResponseCount |
Jumlah tanggapan yang tersimpan dalam indeks sistem di menit terakhir. |
Metrik Penyetelan Otomatis
Amazon OpenSearch Service menyediakan metrik berikut untuk Auto-Tune.
Metrik | Deskripsi |
---|---|
AutoTuneChangesHistoryHeapSize |
Riwayat perubahan di MiB untuk nilai penyetelan ukuran heap. |
AutoTuneChangesHistoryJVMYoungGenArgs |
Sejarah perubahan untuk JVM YongGen argumen. |
AutoTuneFailed |
Boolean yang menunjukkan jika perubahan Auto-Tune gagal. |
AutoTuneSucceeded |
Boolean yang menunjukkan apakah perubahan Auto-Tune berhasil. |
AutoTuneValue |
Riwayat perubahan antrian (hitungan) dan riwayat perubahan penyetelan cache (di MiB) untuk perubahan yang tidak mengganggu. |
Multi-AZ dengan metrik Siaga
Amazon OpenSearch Service menyediakan metrik berikut untuk Multi-AZ dengan Standby.
Metrik tingkat simpul untuk node data di Availability Zone aktif
Metrik | Deskripsi |
---|---|
CPUUtilization |
Persentase CPU penggunaan untuk node data dalam cluster. Maksimum menunjukkan node dengan CPU penggunaan tertinggi. Rata-rata mewakili semua simpul dalam klaster. Metrik ini juga tersedia untuk masing-masing simpul. |
FreeStorageSpace |
Ruang kosong untuk simpul data dalam klaster. Konsol OpenSearch Layanan menampilkan nilai ini di GiB. CloudWatch Konsol Amazon menampilkannya di MiB. |
JVMMemoryPressure |
Persentase maksimum heap Java yang digunakan untuk semua node data di cluster. OpenSearch Layanan menggunakan setengah dari instance RAM untuk heap Java, hingga ukuran heap 32 GiB. Anda dapat menskalakan instance secara vertikal hingga 64 GiBRAM, di mana Anda dapat menskalakan secara horizontal dengan menambahkan instance. Lihat CloudWatch Alarm yang disarankan untuk Layanan Amazon OpenSearch . |
SysMemoryUtilization |
Persentase memori instans yang sedang digunakan. Nilai tinggi untuk metrik ini normal dan biasanya tidak mewakili masalah dengan klaster Anda. Untuk indikator yang lebih baik mengenai potensi masalah performa dan stabilitas, lihat metrik JVMMemoryPressure . |
IndexingLatency |
Perbedaan total waktu, dalam milidetik, diambil oleh semua operasi pengindeksan dalam simpul antara menit N dan menit (N-1). |
IndexingRate |
Jumlah operasi pengindeksan per menit. |
SearchLatency |
Perbedaan total waktu, dalam milidetik, diambil oleh semua pencarian dalam simpul antara menit N dan menit (N-1). |
SearchRate |
Jumlah total permintaan pencarian per menit untuk semua serpihan pada simpul data. |
ThreadpoolSearchQueue |
Jumlah antrean tugas di kolam utas pencarian. Jika ukuran antrean terus tinggi, pertimbangkan untuk menyesuaikan skala klaster Anda. Ukuran antrean pencarian maksimum adalah 1.000. |
ThreadpoolWriteQueue |
Jumlah antrean tugas dalam kolam utas tulis. |
ThreadpoolSearchRejected |
Jumlah tugas yang ditolak dalam kolam utas pencarian. Jika nomor ini terus bertambah, pertimbangkan untuk menyesuaikan skala klaster Anda. |
ThreadpoolWriteRejected |
Jumlah tugas yang ditolak dalam kolam utas tulis. |
Metrik tingkat cluster untuk cluster di Availability Zone aktif
Metrik | Deskripsi |
---|---|
DataNodes |
Jumlah total pecahan aktif dan siaga. |
DataNodesShards.active |
Jumlah total aktif serpihan primer dan replika aktif. |
DataNodesShards.unassigned |
Jumlah serpihan yang tidak dialokasikan ke simpul di klaster. |
DataNodesShards.initializing |
Jumlah serpihan yang berada di bawah inisialisasi. |
DataNodesShards.relocating |
Jumlah serpihan yang berada di bawah relokasi. |
Metrik rotasi Zona Ketersediaan
JikaActiveReads.
, maka zona tersebut aktif. JikaAvailability-Zone
= 1ActiveReads.
, maka zona dalam keadaan siaga.Availability-Zone
=
0
Metrik titik waktu
Amazon OpenSearch Service menyediakan metrik berikut untuk pencarian point in time (PIT).
PITstatistik node koordinator (per node koordinator)
Metrik | Deskripsi |
---|---|
CurrentPointInTime |
Jumlah konteks PIT pencarian aktif di node. |
TotalPointInTime |
Jumlah konteks PIT pencarian kedaluwarsa sejak node up time. |
AvgPointInTimeAliveTime |
Rata-rata tetap hidup dari konteks PIT pencarian sejak node up time. |
HasActivePointInTime |
Nilai 1 menunjukkan bahwa ada PIT konteks aktif pada node sejak node up time. Nilai 0 berarti tidak ada. |
HasUsedPointInTime |
Nilai 1 menunjukkan bahwa ada PIT konteks kedaluwarsa pada node sejak waktu node naik. Nilai 0 berarti tidak ada. |
SQLmetrik
Amazon OpenSearch Service menyediakan metrik berikut untuk SQLdukungan.
Metrik | Deskripsi |
---|---|
SQLFailedRequestCountByCusErr |
Jumlah permintaan Statistik yang relevan: Jumlah |
SQLFailedRequestCountBySysErr |
Jumlah permintaan Statistik yang relevan: Jumlah |
SQLRequestCount |
Jumlah permintaan ke Statistik yang relevan: Jumlah |
SQLDefaultCursorRequestCount |
Mirip dengan Statistik yang relevan: Jumlah |
SQLUnhealthy |
Nilai 1 menunjukkan bahwa, dalam menanggapi permintaan tertentu, SQL plugin mengembalikan kode respons 5 xx atau meneruskan kueri DSL yang tidak valid ke. OpenSearch Permintaan lainnya harus terus berhasil. Nilai 0 menunjukkan tidak ada kegagalan baru-baru ini. Jika Anda melihat nilai berkelanjutan 1, pecahkan masalah permintaan yang klien Anda buat ke plugin. Statistik yang relevan: Maksimum |
metrik k-NN
Amazon OpenSearch Service menyertakan metrik berikut untuk plugin k-nearest neighbor (k-NN).
Metrik | Deskripsi |
---|---|
KNNCacheCapacityReached |
Metrik per simpul untuk melihat apakah kapasitas cache telah tercapai. Metrik ini hanya relevan dengan perkiraan pencarian k-NN. Statistik yang relevan: Maksimum |
KNNCircuitBreakerTriggered |
Metrik per-klaster untuk melihat apakah pemutus sirkuit dipicu. Jika terdapat simpul yang mengembalikan nilai 1 untuk Statistik yang relevan: Maksimum |
KNNEvictionCount |
Metrik per-simpul untuk sejumlah grafik yang telah dikosongkan dari cache karena kendala memori atau waktu siaga. Pengosongan eksplisit yang terjadi karena penghapusan indeks tidak diperhitungkan. Metrik ini hanya relevan dengan perkiraan pencarian k-NN. Statistik yang relevan: Jumlah |
KNNGraphIndexErrors |
Metrik per simpul pada sejumlah permintaan untuk menambahkan Statistik yang relevan: Jumlah |
KNNGraphIndexRequests |
Metrik per simpul pada sejumlah permintaan untuk menambahkan Statistik yang relevan: Jumlah |
KNNGraphMemoryUsage |
Metrik per simpul pada ukuran cache saat ini (ukuran total semua grafik dalam memori) dalam kilobyte. Metrik ini hanya relevan dengan perkiraan pencarian k-NN. Statistik yang relevan: Rata-rata |
KNNGraphQueryErrors |
Metrik per simpul untuk sejumlah kueri grafik yang menghasilkan kesalahan. Statistik yang relevan: Jumlah |
KNNGraphQueryRequests |
Metrik per simpul untuk sejumlah kueri grafik. Statistik yang relevan: Jumlah |
KNNHitCount |
Metrik per simpul untuk sejumlah temuan cache. Sebuah temuan cache terjadi ketika pengguna mengajukan kueri grafik yang sudah dimuat ke dalam memori. Metrik ini hanya relevan dengan perkiraan pencarian k-NN. Statistik yang relevan: Jumlah |
KNNLoadExceptionCount |
Metrik per simpul untuk beberapa kali pengecualian timbul ketika mencoba untuk memuat grafik ke dalam cache. Metrik ini hanya relevan dengan perkiraan pencarian k-NN. Statistik yang relevan: Jumlah |
KNNLoadSuccessCount |
Metrik per simpul untuk frekuensi ketika plugin berhasil memuat grafik ke dalam cache. Metrik ini hanya relevan dengan perkiraan pencarian k-NN. Statistik yang relevan: Jumlah |
KNNMissCount |
Metrik per simpul untuk sejumlah kelalaian cache. Kelalaian cache terjadi ketika pengguna mengajukan kueri grafik yang belum dimuat ke dalam memori. Metrik ini hanya relevan dengan perkiraan pencarian k-NN. Statistik yang relevan: Jumlah |
KNNQueryRequests |
Metrik per simpul untuk sejumlah permintaan kueri yang diterima plugin k-NN. Statistik yang relevan: Jumlah |
KNNScriptCompilationErrors |
Metrik per simpul untuk sejumlah kesalahan selama kompilasi penulisan. Statistik ini hanya relevan dengan pencarian penulisan skor k-NN. Statistik yang relevan: Jumlah |
KNNScriptCompilations |
Metrik per simpul untuk frekuensi kompilasi penulisan k-NN. Nilai ini biasanya harus 1 atau 0, tetapi jika cache yang berisi kompilasi penulisan telah terisi, penulisan k-NN dapat dikompilasi ulang. Statistik ini hanya relevan dengan pencarian penulisan skor k-NN. Statistik yang relevan: Jumlah |
KNNScriptQueryErrors |
Metrik per simpul untuk sejumlah kesalahan selama kueri penulisan. Statistik ini hanya relevan dengan pencarian penulisan skor k-NN. Statistik yang relevan: Jumlah |
KNNScriptQueryRequests |
Metrik per simpul untuk sejumlah total kueri penulisan. Statistik ini hanya relevan dengan pencarian penulisan skor k-NN. Statistik yang relevan: Jumlah |
KNNTotalLoadTime |
Waktu dalam nanodetik yang diperlukan k-NN untuk memuat grafik ke dalam cache. Metrik ini hanya relevan dengan perkiraan pencarian k-NN. Statistik yang relevan: Jumlah |
Metrik pencarian lintas klaster
Amazon OpenSearch Service menyediakan metrik berikut untuk penelusuran lintas klaster.
Metrik domain sumber
Metrik | Dimensi | Deskripsi |
---|---|---|
CrossClusterOutboundConnections |
|
Jumlah simpul yang terhubung. Jika respons Anda mencakup satu atau beberapa domain yang dilewati, gunakan metrik ini untuk melacak koneksi yang tidak sehat. Jika nomor ini turun menjadi 0, maka koneksi tidak sehat. |
CrossClusterOutboundRequests |
|
Jumlah permintaan pencarian yang dikirim ke domain tujuan. Gunakan untuk memeriksa apakah beban permintaan pencarian lintas cluster membanjiri domain Anda, korelasikan lonjakan apa pun dalam metrik ini dengan spike/apa pun. JVM CPU |
Metrik domain tujuan
Metrik | Dimensi | Deskripsi |
---|---|---|
CrossClusterInboundRequests |
|
Jumlah permintaan koneksi masuk yang diterima dari domain sumber. |
Tambahkan CloudWatch alarm jika Anda kehilangan koneksi secara tidak terduga. Untuk langkah-langkah membuat alarm, lihat Membuat CloudWatch Alarm Berdasarkan Ambang Statis.
Metrik replikasi lintas cluster
Amazon OpenSearch Service menyediakan metrik berikut untuk replikasi lintas klaster.
Metrik | Deskripsi |
---|---|
ReplicationRate |
Tingkat rata-rata operasi replikasi per detik. Metrik ini mirip dengan |
LeaderCheckPoint |
Untuk koneksi tertentu, jumlah nilai pos pemeriksaan pemimpin di semua indeks yang mereplikasi. Anda dapat menggunakan metrik ini untuk mengukur latensi replikasi. |
FollowerCheckPoint |
Untuk koneksi tertentu, jumlah nilai pos pemeriksaan pengikut di semua indeks yang mereplikasi. Anda dapat menggunakan metrik ini untuk mengukur latensi replikasi. |
ReplicationNumSyncingIndices |
Jumlah indeks yang memiliki status replikasi. |
ReplicationNumBootstrappingIndices |
Jumlah indeks yang memiliki status replikasi. |
ReplicationNumPausedIndices |
Jumlah indeks yang memiliki status replikasi. |
ReplicationNumFailedIndices |
Jumlah indeks yang memiliki status replikasi. |
|
Jumlah permintaan transpor replikasi pada domain pengikut. Permintaan transportasi bersifat internal dan terjadi setiap kali API operasi replikasi dipanggil. Mereka juga terjadi ketika polling domain pengikut berubah dari domain pemimpin. |
|
Jumlah permintaan transpor replikasi pada domain pemimpin. Permintaan transportasi bersifat internal dan terjadi setiap kali API operasi replikasi dipanggil. |
AutoFollowNumSuccessStartReplication |
Jumlah indeks pengikut yang telah berhasil dibuat oleh aturan replikasi untuk koneksi tertentu. |
AutoFollowNumFailedStartReplication |
Jumlah indeks pengikut yang gagal dibuat oleh aturan replikasi ketika ada pola yang cocok. Masalah ini mungkin timbul karena masalah jaringan di cluster jarak jauh, atau masalah keamanan (yaitu peran terkait tidak memiliki izin untuk memulai replikasi). |
AutoFollowLeaderCallFailure |
Apakah ada kueri yang gagal dari indeks pengikut ke indeks pemimpin untuk menarik data baru. Nilai |
Metrik Learning to Rank
Amazon OpenSearch Service menyediakan metrik berikut untuk Belajar Peringkat.
Metrik | Deskripsi |
---|---|
LTRRequestTotalCount |
Jumlah total permintaan peringkat. |
LTRRequestErrorCount |
Jumlah total permintaan gagal. |
LTRStatus.red |
Melacak jika salah satu indeks yang diperlukan untuk menjalankan plugin berwarna merah. |
LTRMemoryUsage |
Total memori yang digunakan oleh plugin. |
LTRFeatureMemoryUsageInBytes |
Jumlah memori, dalam byte, yang digunakan oleh bidang fitur Learning to Rank. |
LTRFeaturesetMemoryUsageInBytes |
Jumlah memori, dalam byte, yang digunakan oleh seluruh set fitur Learning to Rank. |
LTRModelMemoryUsageInBytes |
Jumlah memori, dalam byte, yang digunakan oleh seluruh model Learning to Rank. |
Metrik Bahasa Pemrosesan yang Disalurkan
Amazon OpenSearch Service menyediakan metrik berikut untuk Bahasa Pemrosesan Piped.
Metrik | Deskripsi |
---|---|
PPLFailedRequestCountByCusErr |
Jumlah permintaan |
PPLFailedRequestCountBySysErr |
Jumlah permintaan |
PPLRequestCount |
Jumlah permintaan ke |