Menangani kerugian Instans Spot di Presto - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menangani kerugian Instans Spot di Presto

Dengan Instans Spot di AmazonEMR, Anda dapat menjalankan beban kerja big data pada EC2 kapasitas Amazon cadangan dengan biaya yang lebih murah. Sebagai imbalan atas biaya yang lebih rendah, Amazon EC2 dapat mengganggu Instans Spot dengan pemberitahuan dua menit. Ketika Anda mengakhiri sebuah node, Presto dapat memakan waktu hingga 10 menit sebelum mengembalikan kesalahan. Hal ini menyebabkan penundaan yang tidak perlu dalam laporan kesalahan dan kemungkinan percobaan ulang. Pengakhiran cepat adalah fitur yang memberi Anda kontrol atas cara Presto menangani node yang dihentikan.

Tugas koordinator Presto adalah melacak semua node pekerja dengan jajak pendapat reguler status mereka. Tanpa penghentian cepat, koordinator tidak berkonsultasi YARN NodeManager untuk status setiap node. Ini dapat menghasilkan loop coba lagi yang panjang sebelum kueri gagal. Dengan penghentian cepat, koordinator Presto berkonsultasi dengan status node NodeManager segera setelah jajak pendapat gagal mencapai tuan rumah. Jika NodeManager menunjukkan bahwa node tidak aktif, Presto meninggalkan percobaan ulang lebih lanjut, gagal kueri, dan mengembalikan kesalahan. NODE_DECOMMISSIONED

Kumpulan parameter konfigurasi berikut memungkinkan Anda untuk mengontrol dan menyesuaikan perilaku Presto jika terjadi penghentian node.

Konfigurasi presto untuk penanganan kegagalan node
Pengaturan Deskripsi Default
query.remote-task.max-backoff-duration Durasi waktu koordinator melanjutkan upaya untuk mengambil status tugas jarak jauh dari node pekerja. 10 menit
query.remote-task.quick-terminate-node-failure

Mengaktifkan kegagalan node cepat jika koordinator tidak dapat mencapai node atau tidak dapat terhubung ke pekerja yang berjalan pada node itu. Nilai query.remote-task.terminate-on-connect-exception menentukan apakah koordinator harus mencapai node atau terhubung ke pekerja.

Node gagal kueri dan Amazon EMR menghapus node dari daftar pekerja yang tersedia. Ketika ini terjadi, Anda tidak dapat menggunakan node untuk menjadwalkan kueri baru.

Ketika Anda menetapkan nilai inifalse, Presto kembali ke perilaku sebelumnya di mana koordinator Presto kembali mencoba untuk mencapai node (forquery.remote-task.max-backoff-duration) sebelum menandai node sebagai tidak tersedia dan gagal kueri yang sedang berlangsung pada node.

true
query.remote-task.terminate-on-connect-exception Menentukan apakah Amazon EMR harus node jika host dapat dijangkau tetapi koordinator gagal terhubung ke proses pekerja host. Saat Anda menetapkan nilai initrue, Anda mengaktifkan kegagalan kueri cepat jika host tidak dapat dijangkau. false