Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pemantauan AWS Glue menggunakan CloudWatch metrik Amazon
Anda dapat membuat profil dan memantau operasi AWS Glue menggunakan pembuat profil tugas AWS Glue. Ini mengumpulkan dan memproses data mentah dari AWS Glue pekerjaan menjadi metrik yang dapat dibaca, mendekati waktu nyata yang disimpan di Amazon. CloudWatch Statistik ini disimpan dan dikumpulkan CloudWatch sehingga Anda dapat mengakses informasi historis untuk perspektif yang lebih baik tentang kinerja aplikasi Anda.
catatan
Anda mungkin dikenakan biaya tambahan saat mengaktifkan metrik pekerjaan dan metrik CloudWatch khusus dibuat. Untuk informasi selengkapnya, lihat CloudWatch harga Amazon
AWS Glueikhtisar metrik
Saat Anda berinteraksiAWS Glue, itu mengirimkan metrik ke CloudWatch. Anda dapat melihat metrik ini menggunakan AWS Glue konsol (metode pilihan), dasbor CloudWatch konsol, atau AWS Command Line Interface (AWS CLI).
Untuk melihat metrik menggunakan dasbor konsol AWS Glue
Anda dapat melihat gambaran umum atau grafik detail metrik untuk tugas, atau grafik terperinci untuk eksekusi tugas.
Masuk ke AWS Management Console, lalu buka konsol AWS Glue di https://console.aws.amazon.com/glue/
. -
Di panel navigasi, pilih Job run monitoring.
-
Di Job run pilih Tindakan untuk menghentikan pekerjaan yang sedang berjalan, melihat pekerjaan, atau memundurkan bookmark pekerjaan.
-
Pilih pekerjaan, lalu pilih Lihat rincian jalankan untuk melihat informasi tambahan tentang pekerjaan yang dijalankan.
Untuk melihat metrik menggunakan dasbor CloudWatch konsol
Metrik dikelompokkan terlebih dahulu berdasarkan namespace layanan, kemudian berdasarkan berbagai kombinasi dimensi dalam setiap namespace.
-
Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/
. -
Di panel navigasi, pilih Metrik.
-
Pilih namespace Glue.
Untuk melihat metrik menggunakan konsol AWS CLI
-
Pada jendela perintah, gunakan perintah berikut.
aws cloudwatch list-metrics --namespace Glue
AWS Gluemelaporkan metrik CloudWatch setiap 30 detik, dan dasbor CloudWatch metrik dikonfigurasi untuk menampilkannya setiap menit. Metrik AWS Glue merupakan nilai delta dari nilai yang dilaporkan sebelumnya. Jika sesuai, dasbor metrik meng-agregat (jumlah) nilai 30 detik untuk mendapatkan nilai untuk seluruh menit terakhir.
AWS Glueperilaku metrik untuk pekerjaan Spark
AWS Gluemetrik diaktifkan pada inisialisasi GlueContext
dalam skrip dan umumnya diperbarui hanya pada akhir tugas Apache Spark. Mereka mewakili nilai-nilai agregat di semua tugas Spark yang sudah selesai sejauh ini.
Namun, metrik Spark yang AWS Glue diteruskan ke umumnya CloudWatch merupakan nilai absolut yang mewakili keadaan saat ini pada saat dilaporkan. AWS Gluemelaporkannya CloudWatch setiap 30 detik, dan dasbor metrik umumnya menunjukkan rata-rata di seluruh titik data yang diterima dalam 1 menit terakhir.
Nama metrik AWS Glue semuanya didahului oleh salah satu jenis prefiks berikut:
glue.driver.
— Metrik yang namanya dimulai dengan prefiks ini mewakili metrik AWS Glue yang dikumpulkan dari semua pelaksana di driver Spark, atau metrik Spark yang sesuai dengan driver Spark.glue.
executorId.
— executorId adalah nomor pelaksana Spark tertentu. Nomor itu sesuai dengan pelaksana yang tercantum dalam log.glue.ALL.
— Metrik yang namanya dimulai dengan prefiks ini menjumlahkan nilai dari semua pelaksana Spark.
Metrik AWS Glue
AWS Glueprofil dan mengirimkan metrik berikut ke CloudWatch setiap 30 detik, dan Dasbor AWS Glue Metrik melaporkannya sekali dalam satu menit:
Metrik | Deskripsi |
---|---|
|
Jumlah byte yang dibaca dari semua sumber data oleh semua tugas Spark yang diselesaikan yang berjalan di semua pelaksana. Dimensi yang valid: Statistik yang valid: SUM. Metrik ini adalah nilai delta dari nilai terakhir yang dilaporkan, jadi pada Dasbor Metrik AWS Glue, statistik SUM digunakan untuk agregasi. Unit: Bita Dapat digunakan untuk memantau:
Metrik ini dapat digunakan dengan cara yang sama seperti metrik |
|
Waktu berlalu ETL dinyatakan dalam milidetik (tidak termasuk waktu bootstrap tugas). Dimensi yang valid: Statistik yang valid: SUM. Metrik ini adalah nilai delta dari nilai terakhir yang dilaporkan, jadi pada Dasbor Metrik AWS Glue, statistik SUM digunakan untuk agregasi. Unit: Milidetik Dapat digunakan untuk menentukan berapa lama waktu rata-rata yang dibutuhkan untuk menjalankan sebuah eksekusi tugas. Beberapa cara menggunakan data:
|
|
Jumlah tahap yang diselesaikan dalam tugas. Dimensi yang valid: Statistik yang valid: SUM. Metrik ini adalah nilai delta dari nilai terakhir yang dilaporkan, jadi pada Dasbor Metrik AWS Glue, statistik SUM digunakan untuk agregasi. Unit: Jumlah Dapat digunakan untuk memantau:
Beberapa cara menggunakan data:
|
|
Jumlah tugas yang telah selesai dalam tugas tersebut. Dimensi yang valid: Statistik yang valid: SUM. Metrik ini adalah nilai delta dari nilai terakhir yang dilaporkan, jadi pada Dasbor Metrik AWS Glue, statistik SUM digunakan untuk agregasi. Unit: Jumlah Dapat digunakan untuk memantau:
|
|
Jumlah tugas yang gagal. Dimensi yang valid: Statistik yang valid: SUM. Metrik ini adalah nilai delta dari nilai terakhir yang dilaporkan, jadi pada Dasbor Metrik AWS Glue, statistik SUM digunakan untuk agregasi. Unit: Jumlah Dapat digunakan untuk memantau:
Data dapat digunakan untuk mengatur alarm untuk peningkatan kegagalan yang mungkin menunjukkan kelainan pada data, klaster atau skrip. |
|
Jumlah tugas yang dihentikan. Dimensi yang valid: Statistik yang valid: SUM. Metrik ini adalah nilai delta dari nilai terakhir yang dilaporkan, jadi pada Dasbor Metrik AWS Glue, statistik SUM digunakan untuk agregasi. Unit: Jumlah Dapat digunakan untuk memantau:
Beberapa cara menggunakan data:
|
|
Jumlah catatan yang dibaca dari semua sumber data oleh semua tugas Spark yang telah diselesaikan yang berjalan di semua pelaksana.. Dimensi yang valid: Statistik yang valid: SUM. Metrik ini adalah nilai delta dari nilai terakhir yang dilaporkan, jadi pada Dasbor Metrik AWS Glue, statistik SUM digunakan untuk agregasi. Unit: Jumlah Dapat digunakan untuk memantau:
Metrik ini dapat digunakan dengan cara yang serupa seperti metrik |
|
Jumlah byte yang ditulis oleh semua pelaksana untuk mengacak data di antara mereka sejak laporan sebelumnya (dijumlahkan oleh Dasbor Metrik AWS Glue sebagai jumlah byte yang ditulis untuk tujuan ini selama menit sebelumnya). Dimensi yang valid: Statistik yang valid: SUM. Metrik ini adalah nilai delta dari nilai terakhir yang dilaporkan, jadi pada Dasbor Metrik AWS Glue, statistik SUM digunakan untuk agregasi. Unit: Bita Dapat digunakan untuk memantau: Acakan data dalam tugas (gabungan besar, groupBy, partisi ulang, menyatu). Beberapa cara menggunakan data:
|
|
Jumlah byte yang dibaca oleh semua pelaksana untuk mengacak data di antara mereka sejak laporan sebelumnya (dijumlahkan oleh Dasbor Metrik AWS Glue sebagai jumlah byte yang dibaca untuk tujuan ini selama menit sebelumnya). Dimensi yang valid: Statistik yang valid: SUM. Metrik ini adalah nilai delta dari nilai terakhir yang dilaporkan, jadi pada Dasbor Metrik AWS Glue, statistik SUM digunakan untuk agregasi. Unit: Bita Dapat digunakan untuk memantau: Acakan data dalam tugas (gabungan besar, groupBy, partisi ulang, menyatu). Beberapa cara menggunakan data:
|
|
Jumlah megabyte ruang disk yang digunakan di semua pelaksana. Dimensi yang valid: Statistik yang valid: Rata-rata. Ini adalah sebuah metrik Spark, yang dilaporkan sebagai nilai absolut. Unit: Megabyte Dapat digunakan untuk memantau:
Beberapa cara menggunakan data:
|
|
Jumlah aktif pelaksana tugas yang berjalan. Dimensi yang valid: Statistik yang valid: Rata-rata. Ini adalah sebuah metrik Spark, yang dilaporkan sebagai nilai absolut. Unit: Jumlah Dapat digunakan untuk memantau:
Beberapa cara menggunakan data:
|
|
Jumlah maksimum (aktif berjalan dan tertunda) pelaksana tugas yang diperlukan untuk memenuhi beban saat ini. Dimensi yang valid: Statistik yang Valid: Maksimum. Ini adalah sebuah metrik Spark, yang dilaporkan sebagai nilai absolut. Unit: Jumlah Dapat digunakan untuk memantau:
Beberapa cara menggunakan data:
|
|
Fraksi memori digunakan oleh tumpukan JVM untuk driver ini (skala: 0-1) untuk driver, pelaksana diidentifikasi oleh executorId, atau SEMUA pelaksana. Dimensi yang valid: Statistik yang valid: Rata-rata. Ini adalah sebuah metrik Spark, yang dilaporkan sebagai nilai absolut. Unit: Persentase Dapat digunakan untuk memantau:
Beberapa cara menggunakan data:
|
|
Jumlah byte memori yang digunakan oleh timbunan JVM untuk driver, pelaksana yang diidentifikasi oleh executorId, atau SEMUA pelaksana. Dimensi yang valid: Statistik yang valid: Rata-rata. Ini adalah sebuah metrik Spark, yang dilaporkan sebagai nilai absolut. Unit: Bita Dapat digunakan untuk memantau:
Beberapa cara menggunakan data:
|
|
Jumlah byte yang dibaca dari Amazon S3 oleh driver, pelaksana yang diidentifkasi oleh executorId, atau SEMUA pelaksana sejak laporan sebelumnya (yang diagregat oleh Dasbor Metrik AWS Glue sebagai jumlah byte yang dibaca selama menit sebelumnya). Dimensi yang valid: Statistik yang valid: SUM. Metrik ini adalah nilai delta dari nilai terakhir yang dilaporkan, jadi pada Dasbor Metrik AWS Glue, statistik SUM digunakan untuk agregasi. Daerah di bawah kurva pada Dasbor Metrik AWS Glue dapat digunakan untuk membandingkan byte dibaca oleh dua eksekusi tugas yang berbeda secara visual. Unit: Byte. Dapat digunakan untuk memantau:
Data yang dihasilkan dapat digunakan untuk:
|
|
Jumlah byte yang ditulis ke Amazon S3 oleh driver, pelaksana yang diidentifkasi oleh executorId, atau SEMUA pelaksana sejak laporan sebelumnya (yang diagregat oleh Dasbor Metrik AWS Glue sebagai jumlah byte yang ditulis selama menit sebelumnya). Dimensi yang valid: Statistik yang valid: SUM. Metrik ini adalah nilai delta dari nilai terakhir yang dilaporkan, jadi pada Dasbor Metrik AWS Glue, statistik SUM digunakan untuk agregasi. Daerah di bawah kurva pada Dasbor Metrik AWS Glue dapat digunakan untuk membandingkan byte ditulis oleh dua eksekusi tugas yang berbeda secara visual. Unit: Bita Dapat digunakan untuk memantau:
Beberapa cara menggunakan data:
|
|
Jumlah catatan yang diterima dalam batch mikro. Metrik ini hanya tersedia untuk pekerjaan AWS Glue streaming dengan AWS Glue versi 2.0 ke atas. Dimensi yang valid: Statistik yang Valid: Jumlah, Maksimum, Minimum, Rata-rata, Persentil Unit: Jumlah Dapat digunakan untuk memantau:
|
|
Waktu yang dibutuhkan untuk memproses batch dalam milidetik. Metrik ini hanya tersedia untuk pekerjaan AWS Glue streaming dengan AWS Glue versi 2.0 ke atas. Dimensi yang valid: Statistik yang Valid: Jumlah, Maksimum, Minimum, Rata-rata, Persentil Unit: Jumlah Dapat digunakan untuk memantau:
|
|
Fraksi beban sistem CPU yang digunakan (skala: 0-1) oleh driver, yakni pelaksana yang diidentifikasi oleh executorId, atau SEMUA pelaksana. Dimensi yang valid: Statistik yang valid: Rata-rata. Ini adalah sebuah metrik yang dilaporkan sebagai nilai absolut. Unit: Persentase Dapat digunakan untuk memantau:
Beberapa cara menggunakan data:
|
Dimensi untuk AWS Glue Metrik
Metrik AWS Glue menggunakan namespace AWS Glue dan menyediakan metrik untuk dimensi berikut:
Dimensi | Deskripsi |
---|---|
|
Dimensi ini mem-filter untuk metrik dari semua eksekusi tugas dari tugas AWS Glue tertentu. |
|
Dimensi ini menyaring metrik AWS Glue pekerjaan tertentu yang dijalankan oleh JobRun ID, atau |
|
Dimensi ini mem-filter untuk metrik dengan |
Untuk informasi selengkapnya, lihat Panduan CloudWatch Pengguna Amazon.