Amazon EMR rilis 6.8.0 - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Amazon EMR rilis 6.8.0

6.8.0 versi aplikasi

Aplikasi berikut didukung dalam rilis ini: Flink,, Ganglia, HBase, HCatalog, Hadoop, Hive, Hudi, Hue, Iceberg, JupyterEnterpriseGatewayJupyterHub, Livy, MXNet, Oozie, Phoenix, Pig, Presto, Spark, Sqoop, TensorFlow, Tez, Trino, Zeppelin, dan ZooKeeper.

Tabel di bawah ini mencantumkan versi aplikasi yang tersedia dalam rilis Amazon EMR ini dan versi aplikasi dalam tiga rilis EMR Amazon sebelumnya (bila berlaku).

Untuk riwayat lengkap versi aplikasi untuk setiap rilis Amazon EMR, lihat topik berikut:

Informasi versi aplikasi
emr-6.8.0 emr-6.7.0 emr-6.6.0 emr-6.5.0
AWS SDK for Java 1.12.1701.12.1701.12.1701.12.31
Python 2.7, 3.72.7, 3.72.7, 3.72.7, 3.7
Skala 2.12.152.12.152.12.102.12.10
AmazonCloudWatchAgent - - - -
Delta - - - -
Flink1.15.11.14.21.14.21.14.0
Ganglia3.7.23.7.23.7.23.7.2
HBase2.4.122.4.42.4.42.4.4
HCatalog3.1.33.1.33.1.23.1.2
Hadoop3.2.13.2.13.2.13.2.1
Hive3.1.33.1.33.1.23.1.2
Hudi0.11.1-amzn-00.11.0-amzn-00.10.1-amzn-00.9.0-amzn-1
Hue4.10.04.10.04.10.04.9.0
Iceberg0.14.0-amzn-00.13.1-amzn-00.13.10.12.0
JupyterEnterpriseGateway2.1.02.1.02.1.02.1.0
JupyterHub1.4.11.4.11.4.11.4.1
Livy0.7.10.7.10.7.10.7.1
MXNet1.9.11.8.01.8.01.8.0
Mahout - - - -
Oozie5.2.15.2.15.2.15.2.1
Phoenix5.1.25.1.25.1.25.1.2
Pig0.17.00.17.00.17.00.17.0
Presto0,2730,2720,2670,261
Spark3.3.03.2.13.2.03.1.2
Sqoop1.4.71.4.71.4.71.4.7
TensorFlow2.9.12.4.12.4.12.4.1
Tez0.9.20.9.20.9.20.9.2
Trino (PrestoSQL)388378367360
Zeppelin0.10.10.10.00.10.00.10.0
ZooKeeper3.5.103.5.73.5.73.5.7

Catatan rilis 6.8.0

Catatan rilis berikut mencakup informasi untuk rilis Amazon EMR 6.8.0. Perubahan relatif terhadap 6.7.0.

Fitur Baru
  • Fitur langkah EMR Amazon sekarang mendukung titik akhir Apache Livy dan klien JDBC/ODBC. Untuk informasi selengkapnya, lihat Mengonfigurasi peran runtime untuk langkah-langkah EMR Amazon.

  • Amazon EMR rilis 6.8.0 hadir dengan rilis Apache HBase 2.4.12. Dengan rilis HBase ini, Anda dapat mengarsipkan dan menghapus tabel HBase Anda. Proses arsip Amazon S3 mengganti nama semua file tabel ke direktori arsip. Ini bisa menjadi proses yang mahal dan panjang. Sekarang, Anda dapat melewati proses arsip dan dengan cepat menjatuhkan dan menghapus tabel besar. Untuk informasi selengkapnya, lihat Menggunakan shell HBase.

Masalah yang Diketahui
  • Hadoop 3.3.3 memperkenalkan perubahan pada YARN (YARN-9608) yang membuat node tempat kontainer berjalan dalam keadaan dekomisioning hingga aplikasi selesai. Perubahan ini memastikan bahwa data lokal seperti data acak tidak hilang, dan Anda tidak perlu menjalankan kembali pekerjaan. Di Amazon EMR 6.8.0 dan 6.9.0, pendekatan ini juga dapat menyebabkan kurangnya pemanfaatan sumber daya pada cluster dengan atau tanpa penskalaan terkelola diaktifkan.

    Dengan Amazon EMR 6.10.0, ada solusi untuk masalah ini untuk menetapkan nilai ke in. yarn.resourcemanager.decommissioning-nodes-watcher.wait-for-applications false yarn-site.xml Di Amazon EMR merilis 6.11.0 dan yang lebih tinggi serta 6.8.1, 6.9.1, dan 6.10.1, konfigurasi disetel ke default untuk menyelesaikan masalah ini. false

Perubahan, Penyempurnaan, dan Masalah Terselesaikan
  • Ketika Amazon EMR merilis 6.5.0, 6.6.0, atau 6.7.0 membaca tabel Apache Phoenix melalui shell Apache Spark, Amazon EMR menghasilkan file. NoSuchMethodError Amazon EMR rilis 6.8.0 memperbaiki masalah ini.

  • Amazon EMR rilis 6.8.0 hadir dengan Apache Hudi 0.11.1; Namun, Amazon EMR 6.8.0 cluster juga kompatibel dengan open-source dari Hudi 0.12.0. hudi-spark3.3-bundle_2.12

  • Amazon EMR rilis 6.8.0 hadir dengan Apache Spark 3.3.0. Rilis Spark ini menggunakan Apache Log4j 2 dan log4j2.properties file untuk mengkonfigurasi Log4j dalam proses Spark. Jika Anda menggunakan Spark di cluster atau membuat kluster EMR dengan parameter konfigurasi kustom, dan Anda ingin meningkatkan ke Amazon EMR rilis 6.8.0, Anda harus bermigrasi ke klasifikasi konfigurasi spark-log4j2 baru dan format kunci untuk Apache Log4j 2. Untuk informasi selengkapnya, lihat Migrasi dari Apache Log4j 1.x ke Log4j 2.x.

  • Saat Anda meluncurkan cluster dengan rilis patch terbaru Amazon EMR 5.36 atau lebih tinggi, atau 6.6 atau lebih tinggi, Amazon EMR menggunakan rilis Amazon Linux 2 terbaru untuk Amazon EMR AMI default. Untuk informasi selengkapnya, lihat Menggunakan AMI Amazon Linux default untuk Amazon EMR.

    catatan

    Rilis ini tidak lagi mendapatkan pembaruan AMI otomatis karena telah digantikan oleh 1 rilis patch lagi. Rilis patch dilambangkan dengan angka setelah titik desimal kedua (). 6.8.1 Untuk melihat apakah Anda menggunakan rilis patch terbaru, periksa rilis yang tersedia di Panduan Rilis, atau periksa dropdown rilis Amazon EMR saat Anda membuat cluster di konsol, atau gunakan tindakan API ListReleaseLabelsatau CLI. list-release-labels Untuk mendapatkan pembaruan tentang rilis baru, berlangganan umpan RSS di Apa yang baru? halaman.

    OsReleaseLabel (Versi Amazon Linux) Versi Kernel Amazon Linux Tanggal Tersedia Wilayah yang Didukung
    2.0.20230808.0 4.14.320 24 Agustus 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Asia Pasifik (Jakarta), Asia Pasifik (Melbourne), Afrika (Cape Town), Amerika Selatan (São Paulo), Timur Tengah (Bahrain), Kanada (Tengah)
    2.0.20230727.0 4.14.320 Agustus 14, 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Eropa (Stockholm), Eropa (Milan), Eropa (Frankfurt), Eropa (Irlandia), Eropa (London), Eropa (Paris), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Asia Pasifik (Jakarta), Asia Pasifik (Melbourne), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain), Kanada (Tengah),
    2.0.20230719.0 4.14.320 2 Agustus 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Eropa (Stockholm), Eropa (Milan), Eropa (Spanyol), Eropa (Frankfurt), Eropa (Zurich), Eropa (Irlandia), Eropa (London), Eropa (Paris), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Hyderabad), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Asia Pasifik (Jakarta), Asia Pasifik (Melbourne), Afrika (Cape Town), Amerika Selatan (São Paulo), Timur Tengah (Bahrain), Timur Tengah (UEA), Kanada (Tengah)
    2.0.20230628.0 4.14.318 Juli 12, 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20230612.0 4.14.314 Juni 23, 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20230504.1 4.14.313 16 Mei 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20230418.0 4.14.311 3 Mei 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20230404.1 4.14.311 April 18, 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20230404.0 4.14.311 April 10, 2023 AS Timur (Virginia N.), Eropa (Paris)
    2.0.20230320.0 4.14.309 30 Maret 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20230307.0 4.14.305 Maret 15, 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20230207.0 4.14.304 Februari 22, 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20230119.1 4.14.301 Februari 3, 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20221210.1 4.14.301 Desember 22, 2023 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20221103.3 4.14.296 Desember 5, 2022 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20221004.0 4.14.294 November 2, 2022 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
    2.0.20220912.1 4.14.291 September 6, 2022 AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (California N.), AS Barat (Oregon), Kanada (Tengah), Eropa (Stockholm), Eropa (Irlandia), Eropa (London), Eropa (Paris), Eropa (Frankfurt), Eropa (Milan), Asia Pasifik (Hong Kong), Asia Pasifik (Mumbai), Asia Pasifik (Jakarta), Asia Pasifik (Tokyo), Asia Pasifik (Seoul), Asia Pasifik (Osaka), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Afrika (Cape Town), Amerika Selatan (Sao Paulo), Timur Tengah (Bahrain)
Masalah yang Diketahui
  • Saat Anda menggunakan konektor DynamoDB dengan Spark di Amazon EMR versi 6.6.0, 6.7.0, dan 6.8.0, semua pembacaan dari tabel Anda mengembalikan hasil kosong, meskipun pemisahan input mereferensikan data yang tidak kosong. Ini karena Spark 3.2.0 disetel spark.hadoopRDD.ignoreEmptySplits ke true default. Sebagai solusinya, setel secara eksplisit ke. spark.hadoopRDD.ignoreEmptySplits false Amazon EMR rilis 6.9.0 memperbaiki masalah ini.

  • Saat Anda menggunakan format lokasi partisi Spark dengan Hive untuk membaca data di Amazon S3, dan Anda menjalankan Spark di Amazon EMR rilis 5.30.0 hingga 5.36.0, dan 6.2.0 hingga 6.9.0, Anda mungkin mengalami masalah yang mencegah klaster membaca data dengan benar. Ini dapat terjadi jika partisi Anda memiliki semua karakteristik berikut:

    • Dua atau lebih partisi dipindai dari tabel yang sama.

    • Setidaknya satu jalur direktori partisi adalah awalan dari setidaknya satu jalur direktori partisi lainnya, misalnya, s3://bucket/table/p=a adalah awalan dari. s3://bucket/table/p=a b

    • Karakter pertama yang mengikuti awalan di direktori partisi lain memiliki nilai UTF-8 yang kurang dari / karakter (U+002F). Misalnya, karakter spasi (U+0020) yang terjadi antara a dan b masuk s3://bucket/table/p=a b termasuk dalam kategori ini. Perhatikan bahwa ada 14 karakter non-kontrol lainnya:!"#$%&‘()*+,-. Untuk informasi selengkapnya, lihat tabel pengkodean UTF-8 dan karakter Unicode.

    Sebagai solusi untuk masalah ini, setel spark.sql.sources.fastS3PartitionDiscovery.enabled konfigurasi ke false dalam klasifikasi. spark-defaults

  • Dengan Amazon EMR merilis 5.36.0 dan 6.6.0 hingga 6.9.0, SecretAgent dan komponen RecordServer layanan mungkin mengalami kehilangan data log karena konfigurasi pola nama file yang salah di properti Log4j2. Konfigurasi yang salah menyebabkan komponen menghasilkan hanya satu file log per hari. Ketika strategi rotasi terjadi, ia menimpa file yang ada alih-alih menghasilkan file log baru seperti yang diharapkan. Sebagai solusinya, gunakan tindakan bootstrap untuk menghasilkan file log setiap jam dan tambahkan bilangan bulat kenaikan otomatis dalam nama file untuk menangani rotasi.

    Untuk Amazon EMR 6.6.0 hingga 6.9.0 rilis, gunakan tindakan bootstrap berikut saat Anda meluncurkan cluster.

    ‑‑bootstrap‑actions "Path=s3://emr-data-access-control-us-east-1/customer-bootstrap-actions/log-rotation-emr-6x/replace-puppet.sh,Args=[]"

    Untuk Amazon EMR 5.36.0, gunakan tindakan bootstrap berikut saat Anda meluncurkan cluster.

    ‑‑bootstrap‑actions "Path=s3://emr-data-access-control-us-east-1/customer-bootstrap-actions/log-rotation-emr-5x/replace-puppet.sh,Args=[]"

Untuk informasi selengkapnya tentang timeline rilis, lihat log perubahan.

6.8.0 versi komponen

Komponen yang diinstal oleh Amazon EMR dengan rilis ini tercantum di bawah ini. Beberapa komponen diinstal sebagai bagian dari paket aplikasi big data. Sedangkan komponen lainnya bersifak unik untuk Amazon EMR dan diinstal untuk proses sistem dan fitur. Ini biasanya dimulai dengan emr atau aws. Paket aplikasi big data dalam rilis Amazon EMR terbaru biasanya versi terbaru yang ditemukan di komunitas. Kami menyediakan rilis komunitas di Amazon EMR secepat mungkin.

Beberapa komponen yang ada di Amazon EMR berbeda dari versi komunitas. Komponen ini mempunyai label versi dalam bentuk CommunityVersion-amzn-EmrVersion. EmrVersion dimulai dari 0. Misalnya, jika komponen komunitas open source bernama myapp-component dengan versi 2.2 telah dimodifikasi tiga kali untuk dimasukkan dalam rilis EMR Amazon yang berbeda, versi rilisnya terdaftar sebagai. 2.2-amzn-2

Komponen Versi Deskripsi
aws-sagemaker-spark-sdk1.4.2Amazon SageMaker Spark SDK
emr-ddb4.16.0Konektor Amazon DynamoDB untuk aplikasi ekosistem Hadoop.
emr-goodies3.2.0Perpustakaan kenyamanan ekstra untuk ekosistem Hadoop.
emr-kinesis3.5.0Konektor Amazon Kinesis untuk aplikasi ekosistem Hadoop.
emr-notebook-env1.7.0Conda env untuk emr notebook yang mencakup gateway jupyter korporasi
emr-s3-dist-cp2.22.0Aplikasi salinan terdistribusi yang dioptimalkan untuk Amazon S3.
emr-s3-select2.1.0EMR S3Select Connector
emrfs2.53.0Konektor Amazon S3 untuk aplikasi ekosistem Hadoop.
flink-client1.15.1Skrip dan aplikasi klien baris perintah Apache Flink.
flink-jobmanager-config1.15.1Mengelola sumber daya pada node EMR untuk Apache Flink. JobManager
ganglia-monitor3.7.2Agen Ganglia tertanam untuk aplikasi ekosistem Hadoop bersama dengan agen pemantauan Ganglia.
ganglia-metadata-collector3.7.2Kolektor metadata Ganglia untuk menggabungkan metrik dari agen pemantauan Ganglia.
ganglia-web3.7.1Aplikasi web untuk melihat metrik yang dikumpulkan oleh kolektor metadata Ganglia.
hadoop-client3.2.1-amzn-8Klien baris perintah Hadoop seperti 'hdfs', 'Hadoop', atau 'yarn'.
hadoop-hdfs-datanode3.2.1-amzn-8Layanan tingkat simpul HDFS untuk menyimpan blok.
hadoop-hdfs-library3.2.1-amzn-8Klien dan perpustakaan baris perintah HDFS
hadoop-hdfs-namenode3.2.1-amzn-8Layanan HDFS untuk melacak nama file dan lokasi blok.
hadoop-hdfs-journalnode3.2.1-amzn-8Layanan HDFS untuk mengelola jurnal filesystem Hadoop pada klaster HA.
hadoop-httpfs-server3.2.1-amzn-8Titik akhir HTTP untuk operasi HDFS.
hadoop-kms-server3.2.1-amzn-8Server manajemen kunci kriptografi berdasarkan API Hadoop. KeyProvider
hadoop-mapred3.2.1-amzn-8MapReduce pustaka mesin eksekusi untuk menjalankan MapReduce aplikasi.
hadoop-yarn-nodemanager3.2.1-amzn-8Layanan YARN untuk mengelola kontainer pada simpul individu.
hadoop-yarn-resourcemanager3.2.1-amzn-8Layanan YARN untuk mengalokasikan dan mengelola sumber daya klaster dan aplikasi terdistribusi.
hadoop-yarn-timeline-server3.2.1-amzn-8Layanan untuk mengambil informasi terkini dan historis untuk aplikasi YARN.
hbase-hmaster2.4.12-amzn-0Layanan untuk klaster HBase bertanggung jawab untuk koordinasi Wilayah dan pelaksanaan perintah administratif.
hbase-region-server2.4.12-amzn-0Layanan untuk melayani satu wilayah HBase atau lebih.
hbase-client2.4.12-amzn-0Klien baris perintah HBase.
hbase-rest-server2.4.12-amzn-0Layanan menyediakan titik akhir HTTP penuh REST untuk HBase.
hbase-thrift-server2.4.12-amzn-0Layanan yang menyediakan titik akhir Thrift untuk HBase.
hbase-operator-tools2.4.12-amzn-0Alat perbaikan untuk cluster Apache HBase.
hcatalog-client3.1.3-amzn-1Klien baris perintah 'hcat' untuk memanipulasi hcatalog-server.
hcatalog-server3.1.3-amzn-1Layanan yang menyediakan HCatalog, lapisan tabel dan pengelolaan penyimpanan untuk aplikasi terdistribusi.
hcatalog-webhcat-server3.1.3-amzn-1Titik akhir HTTP yang menyediakan antarmuka REST untuk HCatalog.
hive-client3.1.3-amzn-1Klien baris perintah Hive.
hive-hbase3.1.3-amzn-1Klien Hive-hbase.
hive-metastore-server3.1.3-amzn-1Layanan untuk mengakses metastore Hive, repositori semantik yang menyimpan metadata untuk SQL pada operasi Hadoop.
hive-server23.1.3-amzn-1Layanan untuk menerima kueri Hive sebagai permintaan web.
hudi0.11.1-amzn-0Kerangka pemrosesan tambahan untuk memberi daya pada pipa data pada latensi rendah dan efisiensi tinggi.
hudi-presto0.11.1-amzn-0Perpustakaan paket untuk menjalankan Presto dengan Hudi.
hudi-trino0.11.1-amzn-0Perpustakaan bundel untuk menjalankan Trino dengan Hudi.
hudi-spark0.11.1-amzn-0Perpustakaan paket untuk menjalankan Spark dengan Hudi.
hue-server4.10.0Aplikasi web untuk menganalisis data menggunakan aplikasi ekosistem Hadoop
iceberg0.14.0-amzn-0Apache Iceberg adalah format tabel terbuka untuk kumpulan data analitik besar
jupyterhub1.4.1Server multi-pengguna untuk notebook Jupyter
livy-server0.7.1-inkubasiAntarmuka REST untuk berinteraksi dengan Apache Spark
nginx1.12.1nginx [engine x] adalah server HTTP dan server proksi balik
mxnet1.9.1Perpustakaan yang fleksibel, dapat diskalakan, dan efisien untuk deep learning.
mariadb-server5.5.68+Server basis data MariaDB.
nvidia-cuda11.7.0Driver Nvidia dan kit alat Cuda
oozie-client5.2.1Klien baris perintah Oozie.
oozie-server5.2.1Layanan untuk menerima permintaan alur kerja Oozie.
opencv4.5.0Perpustakaan Visi Komputer Sumber Terbuka.
phoenix-library5.1.2Perpustakaan phoenix untuk server dan klien
phoenix-connectors5.1.2Konektor Apache Phoenix untuk Spark-3
phoenix-query-server5.1.2Sebuah server ringan yang menyediakan akses JDBC serta Protocol Buffers dan akses format JSON ke API Avatica
presto-coordinator0.273.3-amzn-0Layanan untuk menerima kueri dan mengelola eksekusi kueri antara presto-worker.
presto-worker0.273.3-amzn-0Layanan untuk mengeksekusi potongan kueri.
presto-client0.273.3-amzn-0Klien baris perintah Presto yang diinstal pada master klaster HA yang siaga di mana server Presto server tidak dimulai.
trino-coordinator388-amzn-0Layanan untuk menerima kueri dan mengelola eksekusi kueri di antara trino-workers.
trino-worker388-amzn-0Layanan untuk mengeksekusi potongan kueri.
trino-client388-amzn-0Klien baris perintah Trino yang diinstal pada master siaga cluster HA di mana server Trino tidak dimulai.
pig-client0.17.0Klien baris perintah Pig.
r4.0.2Proyek R untuk Komputasi Statistik
ranger-kms-server2.0.0Sistem Pengelolaan Kunci Ranger Apache
spark-client3.3.0-amzn-0Klien baris perintah Spark.
spark-history-server3.3.0-amzn-0Web UI untuk melihat log acara untuk seluruh masa pakai aplikasi Spark.
spark-on-yarn3.3.0-amzn-0Mesin eksekusi dalam memori untuk YARN.
spark-yarn-slave3.3.0-amzn-0Perpustakaan Apache Spark yang dibutuhkan oleh slave YARN.
spark-rapids22.06.0-amzn-0Plugin Nvidia Spark RAPIDS yang mempercepat Apache Spark dengan GPU.
sqoop-client1.4.7Klien baris perintah Apache Sqoop.
tensorflow2.9.1TensorFlow pustaka perangkat lunak open source untuk perhitungan numerik kinerja tinggi.
tez-on-yarn0.9.2Aplikasi dan perpustakaan tez YARN.
webserver2.4.41+Server HTTP Apache.
zeppelin-server0.10.1Notebook berbasis web yang memungkinkan analisis data interaktif.
zookeeper-server3.5.10Layanan terpusat untuk menjaga informasi konfigurasi, penamaan, yang menyediakan sinkronisasi terdistribusi, dan menyediakan layanan grup.
zookeeper-client3.5.10ZooKeeper klien baris perintah.

6.8.0 klasifikasi konfigurasi

Klasifikasi konfigurasi memungkinkan Anda menyesuaikan aplikasi. Ini sering kali bersesuaian dengan file XML konfigurasi untuk aplikasi, seperti hive-site.xml. Untuk informasi selengkapnya, lihat Konfigurasikan aplikasi.

Tindakan konfigurasi ulang terjadi ketika Anda menentukan konfigurasi untuk grup instans di klaster yang sedang berjalan. Amazon EMR hanya memulai tindakan konfigurasi ulang untuk klasifikasi yang Anda modifikasi. Untuk informasi selengkapnya, lihat Lakukan konfigurasi ulang pada grup instans di klaster yang sedang berjalan.

klasifikasi emr-6.8.0
Klasifikasi Deskripsi Tindakan Konfigurasi Ulang

capacity-scheduler

Ubah nilai dalam file capacity-scheduler.xml Hadoop.

Restarts the ResourceManager service.

container-executor

Ubah nilai dalam file container-executor.cfg Hadoop YARN ini.

Not available.

container-log4j

Ubah nilai dalam file container-log4j.properties Hadoop YARN.

Not available.

core-site

Ubah nilai dalam file core-site.xml Hadoop.

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Ranger KMS, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer.

docker-conf

Ubah pengaturan terkait docker.

Not available.

emrfs-site

Ubah pengaturan EMRFS.

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts HBaseRegionserver, HBaseMaster, HBaseThrift, HBaseRest, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer.

flink-conf

Ubah pengaturan flink-conf.yaml.

Restarts Flink history server.

flink-log4j

Ubah pengaturan log4j.properties Flink.

Restarts Flink history server.

flink-log4j-session

Ubah pengaturan Flink log4j-session.properties untuk sesi Kubernetes/Yarn.

Restarts Flink history server.

flink-log4j-cli

Ubah pengaturan log4j-cli.properties Flink.

Restarts Flink history server.

hadoop-env

Ubah nilai dalam lingkungan Hadoop untuk semua komponen Hadoop.

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts PhoenixQueryserver, HiveServer2, Hive MetaStore, and MapReduce-HistoryServer.

hadoop-log4j

Ubah nilai dalam file log4j.properties Hadoop ini.

Restarts the Hadoop HDFS services SecondaryNamenode, Datanode, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Hadoop Httpfs, and MapReduce-HistoryServer.

hadoop-ssl-server

Ubah konfigurasi server ssl hadoop

Not available.

hadoop-ssl-client

Ubah konfigurasi klien ssl hadoop

Not available.

hbase

Pengaturan terkurasi Amazon EMR untuk Apache HBase.

Custom EMR specific property. Sets emrfs-site and hbase-site configs. See those for their associated restarts.

hbase-env

Ubah nilai dalam lingkungan HBase ini.

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-log4j

Ubah nilai dalam file hbase-log4j.properties HBase.

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-metrics

Ubah nilai dalam file hadoop-metrics2-hbase.properties HBase.

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-policy

Ubah nilai dalam file hbase-policy.xml HBase.

Not available.

hbase-site

Ubah nilai dalam file hbase-site.xml HBase.

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer. Additionally restarts Phoenix QueryServer.

hdfs-encryption-zones

Konfigurasikan zona enkripsi HDFS.

This classification should not be reconfigured.

hdfs-env

Ubah nilai dalam lingkungan HDFS.

Restarts Hadoop HDFS services Namenode, Datanode, and ZKFC.

hdfs-site

Ubah nilai dalam hdfs-site.xml HDFS.

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Additionally restarts Hadoop Httpfs.

hcatalog-env

Ubah nilai dalam lingkungan HCatalog.

Restarts Hive HCatalog Server.

hcatalog-server-jndi

Mengubah nilai dalam jndi.properties HCatalog ini.

Restarts Hive HCatalog Server.

hcatalog-server-proto-hive-site

Ubah nilai proto-hive-site di.xml's HCatalog.

Restarts Hive HCatalog Server.

hcatalog-webhcat-env

Ubah nilai dalam lingkungan HCatalog WebHCAT.

Restarts Hive WebHCat server.

hcatalog-webhcat-log4j2

Ubah nilai dalam log4j2.properties HCatalog WebHCAT.

Restarts Hive WebHCat server.

hcatalog-webhcat-site

Ubah nilai dalam file webhcat-site.xml HCatalog WebHCAT.

Restarts Hive WebHCat server.

hive

Pengaturan dikurasi Amazon EMR untuk Apache Hive.

Sets configurations to launch Hive LLAP service.

hive-beeline-log4j2

Ubah nilai dalam file beeline-log4j2.properties Hive.

Not available.

hive-parquet-logging

Ubah nilai dalam file parquet-logging.properties Hive.

Not available.

hive-env

Ubah nilai dalam lingkungan Hive.

Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore.

hive-exec-log4j2

Ubah nilai dalam file hive-exec-log 4j2.properties Hive.

Not available.

hive-llap-daemon-log4j2

Ubah nilai dalam file llap-daemon-log 4j2.properties Hive.

Not available.

hive-log4j2

Ubah nilai dalam file hive-log4j2.properties Hive.

Not available.

hive-site

Ubah nilai dalam file hive-site.xml Hive

Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore. Also restarts Oozie and Zeppelin.

hiveserver2-site

Ubah nilai dalam file hiveserver2-site.xml Hive Server2

Not available.

hue-ini

Ubah nilai dalam file ini Hue

Restarts Hue. Also activates Hue config override CLI commands to pick up new configurations.

httpfs-env

Ubah nilai di lingkungan HTTPFS.

Restarts Hadoop Httpfs service.

httpfs-site

Ubah nilai dalam file httpfs-site.xml Hadoop.

Restarts Hadoop Httpfs service.

hadoop-kms-acls

Ubah nilai dalam file kms-acls.xml Hadoop.

Not available.

hadoop-kms-env

Ubah nilai dalam lingkungan Hadoop KMS.

Restarts Hadoop-KMS service.

hadoop-kms-log4j

Ubah nilai dalam file kms-log4j.properties Hadoop.

Not available.

hadoop-kms-site

Ubah nilai dalam file kms-site.xml Hadoop.

Restarts Hadoop-KMS and Ranger-KMS service.

hudi-env

Ubah nilai di lingkungan Hudi.

Not available.

hudi-defaults

Ubah nilai dalam file hudi-defaults.conf Hudi.

Not available.

iceberg-defaults

Ubah nilai dalam file iceberg-defaults.conf Iceberg.

Not available.

jupyter-notebook-conf

Ubah nilai dalam file jupyter_notebook_config.py Jupyter Notebook.

Not available.

jupyter-hub-conf

Ubah nilai dalam JupyterHubs file jupyterhub_config.py.

Not available.

jupyter-s3-conf

Konfigurasikan persistensi Jupyter Notebook S3.

Not available.

jupyter-sparkmagic-conf

Ubah nilai dalam file config.json Sparkmagic.

Not available.

livy-conf

Ubah nilai dalam file livy.conf Livy.

Restarts Livy Server.

livy-env

Ubah nilai di lingkungan Livy.

Restarts Livy Server.

livy-log4j

Ubah pengaturan Livy log4j.properties.

Restarts Livy Server.

mapred-env

Ubah nilai di lingkungan MapReduce aplikasi.

Restarts Hadoop MapReduce-HistoryServer.

mapred-site

Ubah nilai dalam file mapred-site.xml MapReduce aplikasi.

Restarts Hadoop MapReduce-HistoryServer.

oozie-env

Ubah nilai di lingkungan Oozie.

Restarts Oozie.

oozie-log4j

Ubah nilai dalam file oozie-log4j.properties Oozie.

Restarts Oozie.

oozie-site

Ubah nilai dalam file oozie-site.xml Oozie.

Restarts Oozie.

phoenix-hbase-metrics

Ubah nilai dalam file hadoop-metrics2-hbase.properties Phoenix.

Not available.

phoenix-hbase-site

Ubah nilai dalam file hbase-site.xml Phoenix.

Not available.

phoenix-log4j

Ubah nilai dalam file log4j.properties Phoenix.

Restarts Phoenix-QueryServer.

phoenix-metrics

Ubah nilai dalam file hadoop-metrics2-phoenix.properties Phoenix.

Not available.

pig-env

Ubah nilai di lingkungan Pig.

Not available.

pig-properties

Ubah nilai dalam file pig.properties Pig.

Restarts Oozie.

pig-log4j

Ubah nilai dalam file log4j.properties Pig.

Not available.

presto-log

Ubah nilai dalam file log.properties Presto.

Restarts Presto-Server (for PrestoDB)

presto-config

Ubah nilai dalam file config.properties Presto.

Restarts Presto-Server (for PrestoDB)

presto-password-authenticator

Ubah nilai dalam file password-authenticator.properties Presto.

Not available.

presto-env

Ubah nilai dalam file presto-env.sh Presto.

Restarts Presto-Server (for PrestoDB)

presto-node

Ubah nilai dalam file node.properties Presto.

Not available.

presto-connector-blackhole

Ubah nilai dalam file blackhole.properties Presto.

Not available.

presto-connector-cassandra

Ubah nilai dalam file cassandra.properties Presto.

Not available.

presto-connector-hive

Ubah nilai dalam file hive.properties Presto.

Restarts Presto-Server (for PrestoDB)

presto-connector-jmx

Ubah nilai dalam file jmx.properties Presto.

Not available.

presto-connector-kafka

Ubah nilai dalam file kafka.properties Presto.

Not available.

presto-connector-localfile

Ubah nilai dalam file localfile.properties Presto.

Not available.

presto-connector-memory

Ubah nilai dalam file memory.properties Presto.

Not available.

presto-connector-mongodb

Ubah nilai dalam file mongodb.properties Presto.

Not available.

presto-connector-mysql

Ubah nilai dalam file mysql.properties Presto.

Not available.

presto-connector-postgresql

Ubah nilai dalam file postgresql.properties Presto.

Not available.

presto-connector-raptor

Ubah nilai dalam file raptor.properties Presto.

Not available.

presto-connector-redis

Ubah nilai dalam file redis.properties Presto.

Not available.

presto-connector-redshift

Ubah nilai dalam file redshift.properties Presto.

Not available.

presto-connector-tpch

Ubah nilai dalam file tpch.properties Presto.

Not available.

presto-connector-tpcds

Ubah nilai dalam file tpcds.properties Presto.

Not available.

trino-log

Ubah nilai dalam file log.properties Trino.

Restarts Trino-Server (for Trino)

trino-config

Ubah nilai dalam file config.properties Trino.

Restarts Trino-Server (for Trino)

trino-password-authenticator

Ubah nilai dalam file password-authenticator.properties Trino.

Restarts Trino-Server (for Trino)

trino-env

Ubah nilai dalam file trino-env.sh Trino.

Restarts Trino-Server (for Trino)

trino-node

Ubah nilai dalam file node.properties Trino.

Not available.

trino-connector-blackhole

Ubah nilai dalam file blackhole.properties Trino.

Not available.

trino-connector-cassandra

Ubah nilai dalam file cassandra.properties Trino.

Not available.

trino-connector-hive

Ubah nilai dalam file hive.properties Trino.

Restarts Trino-Server (for Trino)

trino-connector-iceberg

Ubah nilai dalam file iceberg.properties Trino.

Restarts Trino-Server (for Trino)

trino-connector-jmx

Ubah nilai dalam file jmx.properties Trino.

Not available.

trino-connector-kafka

Ubah nilai dalam file kafka.properties Trino.

Not available.

trino-connector-localfile

Ubah nilai dalam file localfile.properties Trino.

Not available.

trino-connector-memory

Ubah nilai dalam file memory.properties Trino.

Not available.

trino-connector-mongodb

Ubah nilai dalam file mongodb.properties Trino.

Not available.

trino-connector-mysql

Ubah nilai dalam file mysql.properties Trino.

Not available.

trino-connector-postgresql

Ubah nilai dalam file postgresql.properties Trino.

Not available.

trino-connector-raptor

Ubah nilai dalam file raptor.properties Trino.

Not available.

trino-connector-redis

Ubah nilai dalam file redis.properties Trino.

Not available.

trino-connector-redshift

Ubah nilai dalam file redshift.properties Trino.

Not available.

trino-connector-tpch

Ubah nilai dalam file tpch.properties Trino.

Not available.

trino-connector-tpcds

Ubah nilai dalam file tpcds.properties Trino.

Not available.

ranger-kms-dbks-site

Ubah nilai dalam file dbks-site.xml Ranger KMS.

Restarts Ranger KMS Server.

ranger-kms-site

Ubah nilai dalam ranger-kms-site file.xml. dari Ranger KMS.

Restarts Ranger KMS Server.

ranger-kms-env

Ubah nilai di lingkungan Ranger KMS.

Restarts Ranger KMS Server.

ranger-kms-log4j

Ubah nilai dalam file kms-log4j.properties Ranger KMS.

Not available.

ranger-kms-db-ca

Ubah nilai untuk file CA pada S3 untuk koneksi MySQL SSL dengan Ranger KMS.

Not available.

spark

Pengaturan terkurasi Amazon EMR untuk Apache Spark.

This property modifies spark-defaults. See actions there.

spark-defaults

Ubah nilai dalam file spark-defaults.conf Spark.

Restarts Spark history server and Spark thrift server.

spark-env

Ubah nilai di lingkungan Spark.

Restarts Spark history server and Spark thrift server.

spark-hive-site

Ubah nilai dalam file hive-site.xml Spark

Not available.

spark-log4j2

Ubah nilai dalam file log4j2.properties Spark.

Restarts Spark history server and Spark thrift server.

spark-metrics

Ubah nilai dalam file metrics.properties Spark.

Restarts Spark history server and Spark thrift server.

sqoop-env

Ubah nilai dalam lingkungan Sqoop.

Not available.

sqoop-oraoop-site

Ubah nilai dalam file oraoop-site.xml Sqoop OraOop ini.

Not available.

sqoop-site

Ubah nilai dalam file sqoop-site.xml Sqoop.

Not available.

tez-site

Ubah nilai dalam file tez-site.xml Tez.

Restart Oozie and HiveServer2.

yarn-env

Ubah nilai di lingkungan YARN.

Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts MapReduce-HistoryServer.

yarn-site

Ubah nilai dalam file yarn-site.xml YARN.

Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Livy Server and MapReduce-HistoryServer.

zeppelin-env

Ubah nilai di lingkungan Zeppelin.

Restarts Zeppelin.

zeppelin-site

Ubah pengaturan konfigurasi di zeppelin-site.xml.

Restarts Zeppelin.

zookeeper-config

Ubah nilai dalam ZooKeeper file zoo.cfg.

Restarts Zookeeper server.

zookeeper-log4j

Ubah nilai dalam file ZooKeeper log4j.properties.

Restarts Zookeeper server.

6.8.0 perubahan log

Ubah log untuk catatan rilis dan rilis 6.8.0
Tanggal Peristiwa Deskripsi
2023-08-21 Pembaruan Menambahkan masalah yang diketahui dengan Hadoop 3.3.3.
2023-07-26 Pembaruan Label rilis OS baru 2.0.20230612.0 dan2.0.20230628.0.
2022-09-06 Penerapan selesai Amazon EMR 6.8 sepenuhnya dikerahkan ke semua Wilayah yang didukung
2022-09-06 Publikasi awal Amazon EMR 6.8 catatan rilis pertama kali diterbitkan
2022-08-31 Rilis awal Amazon EMR 6.8 dirilis ke Wilayah komersial terbatas