Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pantau kolektor dengan log penjual
Layanan Terkelola Amazon untuk kolektor Prometheus menyediakan log vended untuk membantu Anda memantau dan memecahkan masalah proses pengumpulan metrik. Log ini secara otomatis dikirim ke Amazon CloudWatch Logs dan memberikan visibilitas ke dalam penemuan layanan, pengumpulan metrik, dan operasi ekspor data. Kolektor menjual log untuk tiga komponen utama dari pipa pengumpulan metrik:
Log penemuan layanan
Log penemuan layanan memberikan informasi tentang proses penemuan target, termasuk:
-
Masalah autentikasi atau izin saat mengakses sumber daya API Kubernetes.
-
Kesalahan konfigurasi dalam pengaturan penemuan layanan.
Contoh berikut menunjukkan otentikasi umum dan kesalahan izin yang mungkin Anda temui selama penemuan layanan:
- Cluster Amazon EKS tidak ada
-
Jika klaster Amazon EKS yang ditentukan tidak ada, Anda menerima kesalahan berikut:
{ "component": "SERVICE_DISCOVERY", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "log": "Failed to watch Service - Verify your scraper source exists." }, "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
- Izin tidak valid untuk layanan
-
Ketika kolektor tidak memiliki izin Kontrol Akses Berbasis Peran (RBAC) yang tepat untuk menonton Layanan, Anda menerima kesalahan ini:
{ "component": "SERVICE_DISCOVERY", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "log": "Failed to watch Service - Verify your scraper source permissions are valid." }, "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
- Izin tidak valid untuk titik akhir
-
Ketika kolektor tidak memiliki izin Kontrol Akses Berbasis Peran (RBAC) yang tepat untuk menonton Titik Akhir, Anda menerima kesalahan ini:
{ "component": "SERVICE_DISCOVERY", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "log": "Failed to watch Endpoints - Verify your scraper source permissions are valid." }, "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
Log kolektor
Log kolektor memberikan informasi tentang proses pengikisan metrik, termasuk:
-
Kegagalan gesekan karena titik akhir tidak tersedia.
-
Masalah koneksi saat mencoba mengikis target.
-
Batas waktu selama operasi pengikisan.
-
Kesalahan status HTTP dikembalikan oleh target scrape.
Contoh berikut menunjukkan kesalahan kolektor umum yang mungkin Anda temui selama proses pengikisan metrik:
- Titik akhir metrik tidak ada
-
Ketika
/metrics
titik akhir tidak tersedia pada instance target, Anda menerima kesalahan ini:{ "component": "COLLECTOR", "message": { "log": "Failed to scrape Prometheus endpoint - verify /metrics endpoint is available", "job": "pod_exporter", "targetLabels": "{__name__=\"up\", instance=\10.24.34.0\", job=\"pod_exporter\"}" }, "timestamp": "1752787969551", "scraperId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
- Koneksi ditolak
-
Ketika kolektor tidak dapat membuat koneksi ke titik akhir target, Anda menerima kesalahan ini:
{ "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "message": "Scrape failed", "scrape_pool": "pod_exporter", "target": "http://10.24.34.0:80/metrics", "error": "Get \"http://10.24.34.0:80/metrics\": dial tcp 10.24.34.0:80: connect: connection refused" }, "component": "COLLECTOR" }
Log eksportir
Log eksportir memberikan informasi tentang proses pengiriman metrik yang dikumpulkan ke Layanan Terkelola Amazon Anda untuk ruang kerja Prometheus, termasuk:
-
Jumlah metrik dan titik data yang diproses.
-
Kegagalan ekspor karena masalah ruang kerja.
-
Kesalahan izin saat mencoba menulis metrik.
-
Kegagalan ketergantungan dalam pipa ekspor.
Contoh berikut menunjukkan kesalahan eksportir umum yang mungkin Anda temui selama proses ekspor metrik:
- Ruang kerja tidak ditemukan
-
Ketika ruang kerja target untuk ekspor metrik tidak dapat ditemukan, Anda menerima kesalahan ini:
{ "component": "EXPORTER", "message": { "log": "Failed to export to the target workspace - Verify your scraper destination.", "samplesDropped": 5 }, "timestamp": "1752787969664", "scraperId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
Memahami dan menggunakan log penjual kolektor
Struktur log
Semua log penjual kolektor mengikuti struktur yang konsisten dengan bidang ini:
- scrapeConfigId
-
Pengidentifikasi unik dari konfigurasi scrape yang menghasilkan log.
- stempel waktu
-
Waktu ketika entri log dihasilkan.
- pesan
-
Konten pesan log, yang mungkin mencakup bidang terstruktur tambahan.
- komponen
-
Komponen yang menghasilkan log (SERVICE_DISCOVERY, COLLECTOR, atau EXPORTER)
Menggunakan log vended untuk pemecahan masalah
Log penjual kolektor membantu Anda memecahkan masalah umum dengan pengumpulan metrik:
-
Masalah penemuan layanan
-
Periksa log SERVICE_DISCOVERY untuk otentikasi atau kesalahan izin.
-
Verifikasi bahwa kolektor memiliki izin yang diperlukan untuk mengakses sumber daya Kubernetes.
-
-
Masalah pengikisan metrik
-
Periksa log COLLECTOR untuk kegagalan gesekan.
-
Verifikasi bahwa titik akhir target dapat diakses dan mengembalikan metrik.
-
Pastikan bahwa aturan firewall memungkinkan kolektor untuk terhubung ke titik akhir target.
-
-
Masalah ekspor metrik
-
Periksa log EKSPORTER untuk kegagalan ekspor.
-
Verifikasi bahwa ruang kerja ada dan dikonfigurasi dengan benar.
-
Pastikan kolektor memiliki izin yang diperlukan untuk menulis ke ruang kerja.
-
Mengakses log penjual kolektor
Log penjual kolektor secara otomatis dikirim ke Amazon CloudWatch Logs. Untuk mengakses log ini:
-
Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/
. -
Pada panel navigasi, pilih Grup log.
-
Temukan dan pilih grup log untuk kolektor Anda:
/aws/prometheus/workspace_id/collector/collector_id
. -
Jelajahi atau cari peristiwa log untuk menemukan informasi yang relevan.
Anda juga dapat menggunakan Wawasan CloudWatch Log untuk menanyakan dan menganalisis log kolektor Anda. Misalnya, untuk menemukan semua kesalahan penemuan layanan:
fields @timestamp, message.message | filter component = "SERVICE_DISCOVERY" and message.message like /Failed/ | sort @timestamp desc
Praktik terbaik untuk memantau kolektor
Untuk memantau Layanan Terkelola Amazon Anda secara efektif untuk kolektor Prometheus:
-
Siapkan CloudWatch alarm untuk masalah kolektor kritis, seperti kegagalan pengikisan persisten atau kesalahan ekspor. Untuk informasi selengkapnya, lihat Alarm di Panduan CloudWatch Pengguna Amazon.
-
Buat CloudWatch dasbor untuk memvisualisasikan metrik kinerja kolektor bersama data log yang dijual. Untuk informasi selengkapnya, lihat Dasbor di Panduan CloudWatch Pengguna Amazon.
-
Tinjau log penemuan layanan secara teratur untuk memastikan target ditemukan dengan benar.
-
Pantau jumlah target yang dijatuhkan untuk mengidentifikasi potensi masalah konfigurasi.
-
Lacak kegagalan ekspor untuk memastikan metrik berhasil dikirim ke ruang kerja Anda.