Meningkatkan kinerja AWS Glue untuk pekerjaan Apache Spark - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Meningkatkan kinerja AWS Glue untuk pekerjaan Apache Spark

AWS GlueUntuk meningkatkan kinerja Spark, Anda dapat mempertimbangkan untuk memperbarui parameter terkait kinerja AWS Glue dan Spark tertentu.

Untuk informasi selengkapnya tentang strategi spesifik untuk mengidentifikasi kemacetan melalui metrik dan mengurangi dampaknya, lihat Praktik terbaik untuk penyetelan kinerja untuk pekerjaan Apache Spark di Panduan AWS Glue Preskriptif. AWS Panduan ini memperkenalkan Anda pada topik utama yang berlaku untuk Apache Spark di semua lingkungan runtime, seperti arsitektur Spark dan Kumpulan Data Terdistribusi Tangguh. Dengan menggunakan topik-topik tersebut, panduan ini memandu Anda untuk menerapkan strategi penyetelan kinerja tertentu, seperti mengoptimalkan shuffle dan memparalelkan tugas.

Anda dapat mengidentifikasi kemacetan dengan mengonfigurasi AWS Glue untuk menampilkan UI Spark. Untuk informasi selengkapnya, lihat Memantau pekerjaan menggunakan UI web Apache Spark.

Selain itu, AWS Glue menyediakan fitur kinerja yang mungkin berlaku untuk jenis penyimpanan data tertentu yang terhubung dengan pekerjaan Anda. Informasi referensi tentang parameter kinerja untuk penyimpanan data dapat ditemukan diJenis dan opsi koneksi untuk ETL di AWS Glue untuk Spark.