Apache Hadoop - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Apache Hadoop

Apache Hadoop 是一種開放原始碼的 Java 軟體架構,其可處理執行個體叢集中的大量資料。您可以在單一執行個體或數千個執行個體上執行該架構。Hadoop 使用各種處理模型,例如 MapReduce 和 Tez,在多個實例中分發處理,並且還使用稱為 HDFS 的分佈式文件系統在多個實例中存儲數據。Hadoop 會監控叢集中執行個體的運作狀態,且可從一個或多個節點故障中復原。利用這種方式,Hadoop 提供更大量的處理和儲存容量,以及高可用性。如需詳細資訊,請參閱 Hadoop 文件

以下表格列出了 Amazon EMR 7.x 系列最新版本中包含的 Hadoop 版本,以及 Amazon EMR 隨 Hadoop 一起安裝的元件。

如需此發行版本中隨 Hadoop 一起安裝的元件版本,請參閱版本 7.1.0 元件版本。

對於 EMR 7.1.0 的 Hadoop 版本信息
Amazon EMR 發行標籤 Hadoop 版本 與 Hadoop 一起搭配安裝的元件

埃姆尔 -7.1.0

Hadoop 3.3.6

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server

下表列出 Amazon EMR 6.x 系列最新版本中包含的 Hadoop 版本,以及 Amazon EMR 隨 Hadoop 一起安裝的元件。

如需此版本中與 Hadoop 一起搭配安裝的元件版本,請參閱發行版本 6.15.0 元件版本

emr-6.15.0 的 Hadoop 版本資訊
Amazon EMR 發行標籤 Hadoop 版本 與 Hadoop 一起搭配安裝的元件

emr-6.15.0

Hadoop 3.3.6

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server

下表列出 Amazon EMR 5.x 系列最新版本中包含的 Hadoop 版本,以及 Amazon EMR 隨 Hadoop 一起安裝的元件。

如需此發行版本中隨 Hadoop 一起安裝的元件版本,請參閱版本 5.36.2 元件版本。

適用於 EMR -5.36.2 的 Hadoop 版本資訊
Amazon EMR 發行標籤 Hadoop 版本 與 Hadoop 一起搭配安裝的元件

埃姆尔 -5.36.2

Hadoop 2.10.1

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server

自 Amazon EMR 5.18.0 開始,您可以使用 Amazon EMR 成品儲存庫建置作業程式碼,並將其用於確切的程式庫和相依版本,以搭配特定 Amazon EMR 發行版本使用。如需詳細資訊,請參閱 使用 Amazon EMR 成品儲存庫檢查相依性