Amazon EMR 版本 5.18.0 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon EMR 版本 5.18.0

5.18.0 應用程式版本

此版本支援下列應用程式:Flink, Ganglia, HBase, HCatalog, Hadoop, Hive, Hue, JupyterHub, Livy, MXNet, Mahout, Oozie, Phoenix, Pig, Presto, Spark, Sqoop, TensorFlow, Tez, Zeppelin,以及 ZooKeeper.

下表列出此 Amazon 發行版本中可用的應用程式版本,以EMR及前三個 Amazon 版本中的應用程式EMR版本 (如果適用)。

如需 Amazon 每個版本之應用程式版本的完整歷史記錄EMR,請參閱下列主題:

應用程式版本資訊
emr-5.18.0 emr-5.17.2 emr-5.17.1 emr-5.17.0
AWS SDK對於爪哇 1.11.3931.11.3361.11.3361.11.336
Python 2.72.72.72.7
Scala 2.11.82.11.82.11.82.11.8
AmazonCloudWatchAgent - - - -
Delta - - - -
Flink1.6.01.5.21.5.21.5.2
Ganglia3.7.23.7.23.7.23.7.2
HBase1.4.71.4.61.4.61.4.6
HCatalog2.3.32.3.32.3.32.3.3
Hadoop2.8.42.8.42.8.42.8.4
Hive2.3.32.3.32.3.32.3.3
Hudi - - - -
Hue4.2.04.2.04.2.04.2.0
Iceberg - - - -
JupyterEnterpriseGateway - - - -
JupyterHub0.8.10.8.10.8.10.8.1
Livy0.5.00.5.00.5.00.5.0
MXNet1.2.01.2.01.2.01.2.0
Mahout0.13.00.13.00.13.00.13.0
Oozie5.0.05.0.05.0.05.0.0
Phoenix4.14.04.14.04.14.04.14.0
Pig0.17.00.17.00.17.00.17.0
Presto0.2100.2060.2060.206
Spark2.3.22.3.12.3.12.3.1
Sqoop1.4.71.4.71.4.71.4.7
TensorFlow1.9.01.9.01.9.01.9.0
Tez0.8.40.8.40.8.40.8.4
特里诺 (普雷斯托SQL) - - - -
Zeppelin0.8.00.7.30.7.30.7.3
ZooKeeper3.4.123.4.123.4.123.4.12

5.18.0 版本備註

下列版本說明包含 Amazon 5.18. EMR 0 版本的相關資訊。變更是相對於 5.17.0 版而言。

初始版本日期:2018 年 10 月 24 日

升級
  • Flink 1.6.0

  • HBase1.4.7

  • Presto 0.210

  • Spark 2.3.2

  • Zeppelin 0.8.0

新功能
  • 從 Amazon EMR 5.18.0 開始,您可以使用 Amazon EMR 成品儲存庫,根據特定 Amazon EMR 版本提供的確切程式庫版本和相依性來建立任務程式碼。如需詳細資訊,請參閱使用 Amazon EMR 成品儲存庫檢查相依性

變更、強化功能和已解決的問題

5.18.0 元件版本

下面列出了 Amazon 與此版本一起EMR安裝的元件。其中有一些屬於大數據應用程式套件。其他則是 Amazon 獨有的,EMR並為系統程序和功能安裝。這些通常會以 emraws 開頭。最新 Amazon EMR 版本中的大數據應用程式套件通常是社群中的最新版本。我們會EMR盡快在 Amazon 提供社群版本。

Amazon 中的某些元件EMR與社群版本不同。這些元件具有版本標籤,格式為 CommunityVersion-amzn-EmrVersionEmrVersion 從 0 開始。例如,如果以 2.2 版命名myapp-component的開放原始碼社群元件已經修改三次以包含在不同的 Amazon EMR 版本中,則其發行版本會列為2.2-amzn-2

元件 版本 描述
aws-sagemaker-spark-sdk1.1.3Amazon SageMaker 星火 SDK
emr-ddb4.6.0適用於 Hadoop 生態系統應用程式的 Amazon DynamoDB 連接器。
emr-goodies2.5.0適用 Hadoop 生態系統的超便利程式庫。
emr-kinesis3.4.0適用於 Hadoop 生態系統應用程式的 Amazon Kinesis 連接器。
emr-s3-dist-cp2.10.0針對 Amazon S3 最佳化的分散式複製應用程式。
emr-s3-select1.1.0EMRS3 選擇連接器
emrfs2.27.0適用於 Hadoop 生態系統應用程式的 Amazon S3 連接器。
flink-client1.6.0Apache Flink 命令列用戶端指令碼和應用程式。
ganglia-monitor3.7.2Hadoop 生態系統應用程式內嵌 Ganglia 代理程式以及 Ganglia 監控代理程式。
ganglia-metadata-collector3.7.2Ganglia 監控代理程式的彙總指標 Ganglia 中繼資料收集器。
ganglia-web3.7.1由 Ganglia 中繼資料收集器收集,以檢視指標的 Web 應用程式。
hadoop-client2.8.4-amzn-1Hadoop 命令列用戶端,例如「hdfs」、「Hadoop」或「yarn」。
hadoop-hdfs-datanode2.8.4-amzn-1HDFS用於存儲塊的節點級服務。
hadoop-hdfs-library2.8.4-amzn-1HDFS命令行客戶端和庫
hadoop-hdfs-namenode2.8.4-amzn-1HDFS用於跟踪文件名和塊位置的服務。
hadoop-httpfs-server2.8.4-amzn-1HTTP用於HDFS操作的端點。
hadoop-kms-server2.8.4-amzn-1基於 Hadoop 的加密密鑰管理服務器。 KeyProvider API
hadoop-mapred2.8.4-amzn-1MapReduce 用於執行應用程式的執行引擎 MapReduce 程式庫。
hadoop-yarn-nodemanager2.8.4-amzn-1YARN用於管理個別節點上容器的服務。
hadoop-yarn-resourcemanager2.8.4-amzn-1YARN用於分配和管理叢集資源和分散式應用程式的服務。
hadoop-yarn-timeline-server2.8.4-amzn-1用於擷取應用程式目前和歷史資訊的YARN服務。
hbase-hmaster1.4.7負責協調區域和執行管理命令的HBase叢集服務。
hbase-region-server1.4.7服務於一個或多個HBase地區。
hbase-client1.4.7HBase命令行客戶端。
hbase-rest-server1.4.7提供RESTfulHTTP端點的服務HBase。
hbase-thrift-server1.4.7提供節儉端點的HBase服務。
hcatalog-client2.3.3-amzn-2操作 hcatalog-server 的「hcat」命令列用戶端。
hcatalog-server2.3.3-amzn-2服務提供HCatalog,分佈式應用程序的表和存儲管理層。
hcatalog-webhcat-server2.3.3-amzn-2HTTP提供REST介面的端點HCatalog。
hive-client2.3.3-amzn-2Hive 命令列用戶端。
hive-hbase2.3.3-amzn-2Hive-hbase 用戶端。
hive-metastore-server2.3.3-amzn-2服務訪問蜂巢元存儲,語義存儲的 Hadoop 操作元數據存儲庫。SQL
hive-server22.3.3-amzn-2依 Web 請求接受 Hive 查詢的服務。
hue-server4.2.0使用 Hadoop 生態系統應用程式分析資料的 Web 應用程式
jupyterhub0.8.1適用於 Jupyter 筆記本的多使用者伺服器
livy-server0.5.0-incubatingREST用於與阿帕奇星火交互的接口
nginx1.12.1nginx [引擎 x] 是一個反向代理HTTP服務器
mahout-client0.13.0機器學習程式庫。
mxnet1.2.0靈活有效率的程式庫,具可擴展性,適用於深度學習。
mysql-server5.5.54+我的SQL資料庫伺服器。
nvidia-cuda9.2.88Nvidia 驅動程式和 Cuda 工具組
oozie-client5.0.0Oozie 命令列用戶端。
oozie-server5.0.0接受 Oozie 工作流程要求的服務。
opencv3.4.0開放原始碼電腦 Vision 程式庫。
phoenix-library4.14.0--1.4 HBase適用於伺服器和用戶端的 phoenix 程式庫
phoenix-query-server4.14.0--1.4 HBase輕量級服務器,提供對 Avatica 的JDBC訪問以及協議緩衝區和JSON格式訪問 API
presto-coordinator0.210在 presto-workers 之間接受查詢和執行管理查詢的服務。
presto-worker0.210執行查詢各部分的服務。
pig-client0.17.0Pig 命令列用戶端。
r3.4.1統計運算 R 專案
spark-client2.3.2Spark 命令列用戶端。
spark-history-server2.3.2用於檢視完整 Spark 應用程式生命週期記錄事件的 Web 使用者介面。
spark-on-yarn2.3.2的記憶體內執行引擎。YARN
spark-yarn-slave2.3.2阿帕奇星火庫所需的YARN奴隸。
sqoop-client1.4.7Apache Sqoop 命令列用戶端。
tensorflow1.9.0TensorFlow 用於高性能數值計算的開源軟件庫。
tez-on-yarn0.8.4Tez YARN 應用程式和程式庫。
webserver2.4.25+阿帕奇HTTP服務器。
zeppelin-server0.8.0能進行互動式資料分析,以 Web 為基礎的筆記型電腦。
zookeeper-server3.4.12用於維護組態資訊、命名、提供分散式同步,並提供群組服務的集中化服務。
zookeeper-client3.4.12ZooKeeper 命令行客戶端。

5.18.0 組態類別

組態分類可讓您自訂應用程式。這些通常對應於應用程序的配置XML文件,例如hive-site.xml。如需詳細資訊,請參閱設定應用程式

emr-5.18.0 分類
分類 描述

capacity-scheduler

變更 Hadoop 中 capacity-scheduler.xml 檔案的值。

container-log4j

更改 Hadoop YARN 的容器,日誌 4j. 屬性文件中的值。

core-site

變更 Hadoop 中 core-site.xml 檔案的值。

emrfs-site

變更EMRFS設定。

flink-conf

變更 flink-conf.yaml 設定。

flink-log4j

變更 Flink log4j.properties 設定。

flink-log4j-yarn-session

變更 Flink 記錄 4j-yarn-session. 內容設定。

flink-log4j-cli

變更 Flink log4j-cli.properties 設定。

hadoop-env

在 Hadoop 環境中變更所有 Hadoop 元件的值。

hadoop-log4j

變更 Hadoop 中 log4j.properties 檔案的值。

hadoop-ssl-server

變更 hadoop ssl 伺服器組態

hadoop-ssl-client

變更 hadoop ssl 用戶端組態

hbase

Amazon EMR 策劃的阿帕奇HBase設置。

hbase-env

變更環境中HBase的值。

hbase-log4j

更改值HBase的 hbase-log4j. 屬性文件。

hbase-metrics

更改值中HBase的反向度量 2 hbase.properties 文件。

hbase-policy

變更HBase的 hbase-policy.xml 檔案中的值。

hbase-site

變更HBase的 hbase-site.xml 檔案中的值。

hdfs-encryption-zones

設定HDFS加密區域。

hdfs-site

變更HDFS的 hdfs-site.xml 中的值。

hcatalog-env

變更環境中HCatalog的值。

hcatalog-server-jndi

變更「jndi.properties」中HCatalog的值。

hcatalog-server-proto-hive-site

變更HCatalog的 proto-hive-site .xml 中的值。

hcatalog-webhcat-env

更改 HCatalog W 環境中ebHCat的值。

hcatalog-webhcat-log4j2

更改 HCatalog W ebHCat 的 log4j2. 屬性中的值。

hcatalog-webhcat-site

更改 HCatalog W 的 webhcat-site.xml 文件中ebHCat的值。

hive-beeline-log4j2

變更 Hive 的 beeline-log4j2.properties 檔案中的值。

hive-parquet-logging

變更 Hive 的 parquet-logging.properties 檔案中的值。

hive-env

變更 Hive 環境中的值。

hive-exec-log4j2

更改蜂巢的 hive-exec-log 4j2. 屬性文件中的值。

hive-llap-daemon-log4j2

更改蜂巢的 llap-daemon-log 4j2. 屬性文件中的值。

hive-log4j2

變更 Hive 的 hive-log4j2.properties 檔案中的值。

hive-site

變更 Hive 的 hive-site.xml 檔案中的值

hiveserver2-site

變更 Hive Server2 的 hiveserver2-site.xml 檔案中的值

hue-ini

變更 Hue 的 ini 檔案中的值

httpfs-env

變更HTTPFS環境中的值。

httpfs-site

變更 Hadoop 中 httpfs-site.xml 檔案的值。

hadoop-kms-acls

變更 Hadoop 中 kms-acls.xml 檔案的值。

hadoop-kms-env

變更 Hadoop KMS 環境中的值。

hadoop-kms-log4j

變更 Hadoop 的 kms-log4j.properties 檔案中的值。

hadoop-kms-site

變更 Hadoop 中 kms-site.xml 檔案的值。

jupyter-notebook-conf

變更 Jupyter 筆記本中 jupyter_notebook_config.py 檔案的值。

jupyter-hub-conf

變更 JupyterHubs的 jupyterhub_config.py 檔案中的值。

jupyter-s3-conf

設定 Jupyter 筆記本 S3 持久性。

jupyter-sparkmagic-conf

變更 Sparkmagic 中 config.json 檔案的值。

livy-conf

變更 Livy 的 livy.conf 檔案中的值。

livy-env

變更 Livy 環境中的值。

livy-log4j

變更 Livy log4j.properties 設定。

mapred-env

變更 MapReduce 應用程式環境中的值。

mapred-site

變更 MapReduce 應用程式的 mapred-site.xml 檔案中的值。

oozie-env

變更 Oozie 環境中的值。

oozie-log4j

變更 Oozie 的 oozie-log4j.properties 檔案中的值。

oozie-site

變更 Oozie 的 oozie-site.xml 檔案中的值。

phoenix-hbase-metrics

變更 Phoenix 的 hadoop-metrics2-hbase.properties 檔案中的值。

phoenix-hbase-site

變更 Phoenix 的 hbase-site.xml 檔案中的值。

phoenix-log4j

變更 Phoenix 中 log4j.properties 檔案的值。

phoenix-metrics

變更 Phoenix 的 hadoop-metrics2-phoenix.properties 檔案中的值。

pig-env

在 Pig 環境中變更值。

pig-properties

變更 Pig 的 pig.properties 檔案中的值。

pig-log4j

變更 Pig 的 log4j.properties 檔案中的值。

presto-log

變更 Presto 的 log.properties 檔案中的值。

presto-config

變更 Presto 的 config.properties 檔案中的值。

presto-password-authenticator

變更 Presto 的 password-authenticator.properties 檔案中的值。

presto-env

變更 Presto 的 presto-env.sh 檔案中的值。

presto-node

變更 Presto 的 node.properties 檔案中的值。

presto-connector-blackhole

變更 Presto 的 blackhole.properties 檔案中的值。

presto-connector-cassandra

變更 Presto 的 cassandra.properties 檔案中的值。

presto-connector-hive

變更 Presto 的 hive.properties 檔案中的值。

presto-connector-jmx

變更 Presto 的 jmx.properties 檔案中的值。

presto-connector-kafka

變更 Presto 的 kafka.properties 檔案中的值。

presto-connector-localfile

變更 Presto 的 localfile.properties 檔案中的值。

presto-connector-mongodb

變更 Presto 的 mongodb.properties 檔案中的值。

presto-connector-mysql

變更 Presto 的 mysql.properties 檔案中的值。

presto-connector-postgresql

變更 Presto 的 postgresql.properties 檔案中的值。

presto-connector-raptor

變更 Presto 的 raptor.properties 檔案中的值。

presto-connector-redis

變更 Presto 的 redis.properties 檔案中的值。

presto-connector-redshift

變更 Presto 的 redshift.properties 檔案中的值。

presto-connector-tpch

變更 Presto 的 tpch.properties 檔案中的值。

spark

Amazon EMR 策劃的阿帕奇星火設置。

spark-defaults

變更 Spark 的 spark-defaults.conf 檔案中的值。

spark-env

變更 Spark 環境中的值。

spark-hive-site

變更 Spark 的 hive-site.xml 檔案中的值

spark-log4j

變更 Spark 中 log4j.properties 檔案的值。

spark-metrics

變更 Spark 中 metrics.properties 檔案的值。

sqoop-env

變更 Sqoop 環境中的值。

sqoop-oraoop-site

在方向 OraOop的 oraoop-site.xml 文件中更改值。

sqoop-site

變更 Sqoop 的 sqoop-site.xml 檔案中的值。

tez-site

變更 Tez 的 tez-site.xml 檔案中的值。

yarn-env

變更YARN環境中的值。

yarn-site

變更YARN的 yarn-site.xml 檔案中的值。

zeppelin-env

變更 Zeppelin 環境中的值。

zookeeper-config

變更 ZooKeeper的 zoo.cfg 檔案中的值。

zookeeper-log4j

變更 log4j. 屬性 ZooKeeper檔案中的值。