Apache Hadoop - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Apache Hadoop

Apache Hadoop adalah kerangka kerja perangkat lunak Java sumber terbuka yang mendukung pemrosesan data besar-besaran di seluruh klaster instans. Hal ini dapat berjalan pada satu atau ribuan instans. Hadoop menggunakan berbagai model pemrosesan, seperti MapReduce dan Tez, untuk mendistribusikan pemrosesan di beberapa instance dan juga menggunakan sistem file terdistribusi yang disebut HDFS untuk menyimpan data di beberapa instance. Hadoop memonitor kesehatan instans dalam klaster dan dapat memulihkan satu kegagalan simpul atau lebih. Dengan cara ini, Hadoop menyediakan peningkatan pengolahan dan kapasitas penyimpanan, serta ketersediaan tinggi. Untuk informasi lebih lanjut, lihat dokumentasi Hadoop.

Tabel berikut mencantumkan versi Hadoop yang termasuk dalam rilis terbaru seri Amazon EMR 7.x, bersama dengan komponen yang dipasang Amazon EMR dengan Hadoop.

Untuk versi komponen yang diinstal dengan Hadoop dalam rilis ini, lihat Rilis Versi Komponen 7.1.0.

Informasi versi Hadoop untuk emr-7.1.0
Label Rilis Amazon EMR Versi Hadoop Komponen Dipasang Dengan Hadoop

emr-7.1.0

Hadoop 3.3.6

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server

Tabel berikut mencantumkan versi Hadoop yang termasuk dalam rilis terbaru seri Amazon EMR 6.x, bersama dengan komponen yang dipasang Amazon EMR dengan Hadoop.

Untuk versi komponen yang diinstal dengan Hadoop dalam rilis ini, lihat Rilis Versi Komponen 6.15.0.

Informasi versi Hadoop untuk emr-6.15.0
Label Rilis Amazon EMR Versi Hadoop Komponen Dipasang Dengan Hadoop

emr-6.15.0

Hadoop 3.3.6

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server

Tabel berikut mencantumkan versi Hadoop yang termasuk dalam rilis terbaru seri Amazon EMR 5.x, bersama dengan komponen yang dipasang Amazon EMR dengan Hadoop.

Untuk versi komponen yang diinstal dengan Hadoop dalam rilis ini, lihat Rilis 5.36.2 Versi Komponen.

Informasi versi Hadoop untuk emr-5.36.2
Label Rilis Amazon EMR Versi Hadoop Komponen Dipasang Dengan Hadoop

emr-5.36.2

Hadoop 2.10.1

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server

Dimulai dengan Amazon EMR 5.18.0, Anda dapat menggunakan repositori artefak Amazon EMR untuk membangun kode pekerjaan Anda terhadap versi pustaka dan dependensi yang tepat yang tersedia dengan rilis EMR Amazon tertentu. Untuk informasi selengkapnya, lihat Memeriksa dependensi menggunakan repositori artefak Amazon EMR.