Amazon EMR 5.1.0 版 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon EMR 5.1.0 版

5.1.0 應用程式版本

此版本支援下列應用程式:FlinkGangliaHBaseHCatalogHadoopHiveHueMahoutOoziePhoenixPigPrestoSparkSqoopTezZeppelinZooKeeper

下表列出此 Amazon EMR 版本中提供的應用程式版本,以及前三個 Amazon EMR 版本 (如果適用) 中的應用程式版本。

如需完整了解各 Amazon EMR 版之應用程式版本的完整歷史記錄,請參閱以下主題:

應用程式版本資訊
emr-5.1.0 emr-5.0.3 emr-5.0.2 emr-5.0.1
AWS SDK for Java 1.10.751.10.751.10.751.10.75
Python 未追蹤未追蹤未追蹤未追蹤
Scala 2.11.82.11.82.11.82.11.8
AmazonCloudWatchAgent - - - -
Delta - - - -
Flink1.1.3 - - -
Ganglia3.7.23.7.23.7.23.7.2
HBase1.2.31.2.21.2.21.2.2
HCatalog2.1.02.1.02.1.02.1.0
Hadoop2.7.32.7.32.7.22.7.2
Hive2.1.02.1.02.1.02.1.0
Hudi - - - -
Hue3.10.03.10.03.10.03.10.0
Iceberg - - - -
JupyterEnterpriseGateway - - - -
JupyterHub - - - -
Livy - - - -
MXNet - - - -
Mahout0.12.20.12.20.12.20.12.2
Oozie4.2.04.2.04.2.04.2.0
Phoenix4.7.04.7.04.7.04.7.0
Pig0.16.00.16.00.16.00.16.0
Presto0.152.30.152.30.1500.150
Spark2.0.12.0.12.0.02.0.0
Sqoop1.4.61.4.61.4.61.4.6
TensorFlow - - - -
Tez0.8.40.8.40.8.40.8.4
Trino (PrestoSQL) - - - -
Zeppelin0.6.20.6.10.6.10.6.1
ZooKeeper3.4.83.4.83.4.83.4.8

5.1.0 版本備註

以下版本備註包含 Amazon EMR 5.1.0 版的資訊。變更是相對於 Amazon EMR 5.0.3 版而言。

版本日期:2016 年 11 月 3 日

變更與強化功能
  • 新增對 Flink 1.1.3 的支援。

  • Presto 已新增為 Hue 筆記本區段中的選項。

升級
  • 升級至 HBase 1.2.3

  • 升級至 Zeppelin 0.6.2

解決先前版本的已知問題
  • 修正在 Amazon S3 上以 ORC 檔案執行 Tez 查詢之效果不如先前 Amazon EMR 4.x 版本的問題。

5.1.0 元件版本

Amazon EMR 在此版本安裝的元件列出如下。其中有一些屬於大數據應用程式套件。其他的則為 Amazon EMR 獨有,並安裝為系統程序和功能。這些通常會以 emraws 開頭。在最新 Amazon EMR 版本中的大數據應用程式套件,通常也是社群中可找到的最新版本。我們致力盡快提供 Amazon EMR 的社群版本。

Amazon EMR 中的某些元件與社群版本不同。這些元件具有版本標籤,格式為 CommunityVersion-amzn-EmrVersionEmrVersion 從 0 開始。例如,假設有一個名為 myapp-component 的開放原始碼社群元件 2.2 版為了包含在不同 Amazon EMR 發行版本中而修改過三次,則其發行版本會列為 2.2-amzn-2

元件 版本 描述
emr-ddb4.1.0適用於 Hadoop 生態系統應用程式的 Amazon DynamoDB 連接器。
emr-goodies2.1.0適用 Hadoop 生態系統的超便利程式庫。
emr-kinesis3.2.0適用於 Hadoop 生態系統應用程式的 Amazon Kinesis 連接器。
emr-s3-dist-cp2.4.0針對 Amazon S3 最佳化的分散式複製應用程式。
emrfs2.11.0適用於 Hadoop 生態系統應用程式的 Amazon S3 連接器。
flink-client1.1.3Apache Flink 命令列用戶端指令碼和應用程式。
ganglia-monitor3.7.2Hadoop 生態系統應用程式內嵌 Ganglia 代理程式以及 Ganglia 監控代理程式。
ganglia-metadata-collector3.7.2Ganglia 監控代理程式的彙總指標 Ganglia 中繼資料收集器。
ganglia-web3.7.1由 Ganglia 中繼資料收集器收集,以檢視指標的 Web 應用程式。
hadoop-client2.7.3-amzn-0Hadoop 命令列用戶端,例如「hdfs」、「Hadoop」或「yarn」。
hadoop-hdfs-datanode2.7.3-amzn-0用於存放區塊的 HDFS 節點層級服務。
hadoop-hdfs-library2.7.3-amzn-0HDFS 命令列用戶端和程式庫
hadoop-hdfs-namenode2.7.3-amzn-0用於追蹤檔案名稱和區塊位置的 HDFS 服務。
hadoop-httpfs-server2.7.3-amzn-0HDFS 操作的 HTTP 端點。
hadoop-kms-server2.7.3-amzn-0基於 Hadoop 的 KeyProvider API 的加密密鑰管理服務器。
hadoop-mapred2.7.3-amzn-0MapReduce 用於執行應用程式的執行引擎 MapReduce 程式庫。
hadoop-yarn-nodemanager2.7.3-amzn-0在個別節點用於管理容器的 YARN 服務。
hadoop-yarn-resourcemanager2.7.3-amzn-0用於分配和管理叢集資源,以及分散式應用程式的 YARN 服務。
hadoop-yarn-timeline-server2.7.3-amzn-0為 YARN 應用程式擷取目前和歷史資訊的服務。
hbase-hmaster1.2.3負責區域協調和執行管理命令的 HBase 叢集服務。
hbase-region-server1.2.3提供一或多個 HBase 區域的服務。
hbase-client1.2.3HBase 命令列用戶端。
hbase-rest-server1.2.3為 HBase 提供 RESTful HTTP 端點的服務。
hbase-thrift-server1.2.3提供 Thrift 端點到 HBase 的服務。
hcatalog-client2.1.0-amzn-0操作 hcatalog-server 的「hcat」命令列用戶端。
hcatalog-server2.1.0-amzn-0服務為分散式應用程式提供 HCatalog、表格和儲存管理層。
hcatalog-webhcat-server2.1.0-amzn-0HTTP 端點提供了 REST 介面至 HCatalog。
hive-client2.1.0-amzn-0Hive 命令列用戶端。
hive-metastore-server2.1.0-amzn-0為 Hadoop 操作的 SQL 提供存取 Hive 中繼儲存、存放中繼資料語意儲存庫的服務。
hive-server2.1.0-amzn-0依 Web 請求接受 Hive 查詢的服務。
hue-server3.10.0-amzn-0使用 Hadoop 生態系統應用程式分析資料的 Web 應用程式
mahout-client0.12.2機器學習程式庫。
mysql-server5.5.52MySQL 資料庫伺服器。
oozie-client4.2.0Oozie 命令列用戶端。
oozie-server4.2.0接受 Oozie 工作流程要求的服務。
phoenix-library4.7.0-HBase-1.2適用於伺服器和用戶端的 phoenix 程式庫
phoenix-query-server4.7.0-HBase-1.2此為一輕量伺服器,可提供對 Avatica API 的 JDBC 存取以及通訊協定緩衝區和 JSON 格式存取
presto-coordinator0.152.3在 presto-workers 之間接受查詢和執行管理查詢的服務。
presto-worker0.152.3執行查詢各部分的服務。
pig-client0.16.0-amzn-0Pig 命令列用戶端。
spark-client2.0.1Spark 命令列用戶端。
spark-history-server2.0.1用於檢視完整 Spark 應用程式生命週期記錄事件的 Web 使用者介面。
spark-on-yarn2.0.1適用於 YARN 的記憶體內執行引擎。
spark-yarn-slave2.0.1YARN 從屬所需的 Apache Spark 程式庫。
sqoop-client1.4.6Apache Sqoop 命令列用戶端。
tez-on-yarn0.8.4tez YARN 應用程式和程式庫。
webserver2.4.23Apache HTTP 伺服器。
zeppelin-server0.6.2能進行互動式資料分析,以 Web 為基礎的筆記型電腦。
zookeeper-server3.4.8用於維護組態資訊、命名、提供分散式同步,並提供群組服務的集中化服務。
zookeeper-client3.4.8ZooKeeper 命令行客戶端。

5.1.0 組態類別

組態分類可讓您自訂應用程式。這些檔案通常對應於應用程式的組態 XML 檔案,例如 hive-site.xml。如需詳細資訊,請參閱 設定應用程式

emr-5.1.0 分類
分類 描述

capacity-scheduler

變更 Hadoop 中 capacity-scheduler.xml 檔案的值。

core-site

變更 Hadoop 中 core-site.xml 檔案的值。

emrfs-site

變更 EMRFS 設定。

flink-conf

變更 flink-conf.yaml 設定。

flink-log4j

變更 Flink log4j.properties 設定。

flink-log4j-yarn-session

變更 Flink 記錄 4j-yarn-session. 內容設定。

flink-log4j-cli

變更 Flink log4j-cli.properties 設定。

hadoop-env

在 Hadoop 環境中變更所有 Hadoop 元件的值。

hadoop-log4j

變更 Hadoop 中 log4j.properties 檔案的值。

hadoop-ssl-server

變更 hadoop ssl 伺服器組態

hadoop-ssl-client

變更 hadoop ssl 用戶端組態

hbase-env

變更 HBase 環境中的值。

hbase-log4j

變更 HBase 的 hbase-log4j.properties 檔案中的值。

hbase-metrics

變更 HBase 的 hadoop-metrics2-hbaase.properties 檔案中的值。

hbase-policy

變更 HBase 的 hbase-policy.xml 檔案中的值。

hbase-site

變更 HBase 的 hbase-site.xml 檔案中的值。

hdfs-encryption-zones

設定 HDFS 加密區域。

hdfs-site

變更 HDFS 的 hdfs-site.xml 中的值。

hcatalog-env

變更 HCatalog 環境中的值。

hcatalog-server-jndi

變更 HCatalog 的 jndi.properties 中的值。

hcatalog-server-proto-hive-site

更改 H 目錄的 proto-hive-site .xml 值。

hcatalog-webhcat-env

變更 HCatalog WebHCat 環境中的值。

hcatalog-webhcat-log4j2

變更 HCatalog WebHCat 的 log4j2.properties 中的值。

hcatalog-webhcat-site

變更 HCatalog WebHCat 的 webhcat-site.xml 檔案中的值。

hive-beeline-log4j2

變更 Hive 的 beeline-log4j2.properties 檔案中的值。

hive-env

變更 Hive 環境中的值。

hive-exec-log4j2

更改蜂巢的 hive-exec-log 4j2. 屬性文件中的值。

hive-llap-daemon-log4j2

更改蜂巢的 llap-daemon-log 4j2. 屬性文件中的值。

hive-log4j2

變更 Hive 的 hive-log4j2.properties 檔案中的值。

hive-site

變更 Hive 的 hive-site.xml 檔案中的值

hiveserver2-site

變更 Hive Server2 的 hiveserver2-site.xml 檔案中的值

hue-ini

變更 Hue 的 ini 檔案中的值

httpfs-env

變更 HTTPFS 環境中的值。

httpfs-site

變更 Hadoop 中 httpfs-site.xml 檔案的值。

hadoop-kms-acls

變更 Hadoop 中 kms-acls.xml 檔案的值。

hadoop-kms-env

變更 Hadoop KMS 環境中的值。

hadoop-kms-log4j

變更 Hadoop 的 kms-log4j.properties 檔案中的值。

hadoop-kms-site

變更 Hadoop 中 kms-site.xml 檔案的值。

mapred-env

變更 MapReduce 應用程式環境中的值。

mapred-site

變更 MapReduce 應用程式的 mapred-site.xml 檔案中的值。

oozie-env

變更 Oozie 環境中的值。

oozie-log4j

變更 Oozie 的 oozie-log4j.properties 檔案中的值。

oozie-site

變更 Oozie 的 oozie-site.xml 檔案中的值。

phoenix-hbase-metrics

變更 Phoenix 的 hadoop-metrics2-hbase.properties 檔案中的值。

phoenix-hbase-site

變更 Phoenix 的 hbase-site.xml 檔案中的值。

phoenix-log4j

變更 Phoenix 中 log4j.properties 檔案的值。

phoenix-metrics

變更 Phoenix 的 hadoop-metrics2-phoenix.properties 檔案中的值。

pig-properties

變更 Pig 的 pig.properties 檔案中的值。

pig-log4j

變更 Pig 的 log4j.properties 檔案中的值。

presto-log

變更 Presto 的 log.properties 檔案中的值。

presto-config

變更 Presto 的 config.properties 檔案中的值。

presto-connector-blackhole

變更 Presto 的 blackhole.properties 檔案中的值。

presto-connector-cassandra

變更 Presto 的 cassandra.properties 檔案中的值。

presto-connector-hive

變更 Presto 的 hive.properties 檔案中的值。

presto-connector-jmx

變更 Presto 的 jmx.properties 檔案中的值。

presto-connector-kafka

變更 Presto 的 kafka.properties 檔案中的值。

presto-connector-localfile

變更 Presto 的 localfile.properties 檔案中的值。

presto-connector-mongodb

變更 Presto 的 mongodb.properties 檔案中的值。

presto-connector-mysql

變更 Presto 的 mysql.properties 檔案中的值。

presto-connector-postgresql

變更 Presto 的 postgresql.properties 檔案中的值。

presto-connector-raptor

變更 Presto 的 raptor.properties 檔案中的值。

presto-connector-redis

變更 Presto 的 redis.properties 檔案中的值。

presto-connector-tpch

變更 Presto 的 tpch.properties 檔案中的值。

spark

Apache Spark 的 Amazon EMR 彙整設定。

spark-defaults

變更 Spark 的 spark-defaults.conf 檔案中的值。

spark-env

變更 Spark 環境中的值。

spark-hive-site

變更 Spark 的 hive-site.xml 檔案中的值

spark-log4j

變更 Spark 中 log4j.properties 檔案的值。

spark-metrics

變更 Spark 中 metrics.properties 檔案的值。

sqoop-env

變更 Sqoop 環境中的值。

sqoop-oraoop-site

在方向 OraOop的 oraoop-site.xml 文件中更改值。

sqoop-site

變更 Sqoop 的 sqoop-site.xml 檔案中的值。

tez-site

變更 Tez 的 tez-site.xml 檔案中的值。

yarn-env

變更 YARN 環境中的值。

yarn-site

變更 YARN 的 yarn-site.xml 檔案中的值。

zeppelin-env

變更 Zeppelin 環境中的值。

zookeeper-config

變更 ZooKeeper的 zoo.cfg 檔案中的值。

zookeeper-log4j

變更 log4j. 屬性 ZooKeeper檔案中的值。