Amazon EMR 6.15.0 版 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon EMR 6.15.0 版

6.15.0 應用程式版本

此版本支援下列應用程式:DeltaFlinkGangliaHBaseHCatalogHadoopHiveHudiHueIcebergJupyterEnterpriseGatewayJupyterHubLivyMXNetOoziePhoenixPigPrestoSparkSqoopTensorFlowTezTrinoZeppelinZooKeeper

下表列出此 Amazon EMR 版本中提供的應用程式版本,以及前三個 Amazon EMR 版本 (如果適用) 中的應用程式版本。

如需完整了解各 Amazon EMR 版之應用程式版本的完整歷史記錄,請參閱以下主題:

應用程式版本資訊
emr-6.15.0 emr-6.14.0 emr-6.13.0 emr-6.12.0
AWS SDK for Java 2.20.160-amzn-0、1.12.5691.12.5431.12.5131.12.490
Python 2.7、3.72.7、3.72.7、3.72.7、3.7
Scala 2.12.172.12.152.12.152.12.15
AmazonCloudWatchAgent - - - -
Delta2.4.02.4.02.4.02.4.0
Flink1.17.11.17.11.17.01.17.0
Ganglia3.7.23.7.23.7.23.7.2
HBase2.4.172.4.172.4.172.4.17
HCatalog3.1.33.1.33.1.33.1.3
Hadoop3.3.63.3.33.3.33.3.3
Hive3.1.33.1.33.1.33.1.3
Hudi0.14.0-amzn-00.13.1-amzn-20.13.1-amzn-10.13.1-amzn-0
Hue4.11.04.11.04.11.04.11.0
Iceberg1.4.0-amzn-01.3.1-amzn-01.3.0-amzn-11.3.0-amzn-0
JupyterEnterpriseGateway2.6.02.6.02.6.02.6.0
JupyterHub1.5.01.5.01.5.01.4.1
Livy0.7.10.7.10.7.10.7.1
MXNet1.9.11.9.11.9.11.9.1
Mahout - - - -
Oozie5.2.15.2.15.2.15.2.1
Phoenix5.1.35.1.35.1.35.1.3
Pig0.17.00.17.00.17.00.17.0
Presto0.2830.2810.2810.281
Spark3.4.13.4.13.4.13.4.0
Sqoop1.4.71.4.71.4.71.4.7
TensorFlow2.11.02.11.02.11.02.11.0
Tez0.10.20.10.20.10.20.10.2
Trino (PrestoSQL)426422414414
Zeppelin0.10.10.10.10.10.10.10.1
ZooKeeper3.5.103.5.103.5.103.5.10

6.15.0 版本備註

以下版本備註包含 Amazon EMR 6.15.0 版的資訊。變更是相對於 6.14.0 版而言。如需有關發行時間表的資訊,請參閱 6.15.0 變更日誌

新功能
  • 應用程式升級:Amazon EMR 6.15.0 application upgrades include Apache Hadoop 3.3.6, Apache Hudi 0.14.0-amzn-0, Iceberg 1.4.0-amzn-0, and Trino 426.

  • 在 EC2 上執行的 EMR 叢集啟動速度更快:現在啟動 EC2 上的 Amazon EMR 叢集的速度快了 35%。透過這項改善,大多數客戶就可以在 5 分鐘或更短的時間內啟動叢集。

  • CodeWhisperer 適用於 EMR 工作室 — 您現在可以將 Amazon CodeWhisperer 與 Amazon EMR 工作室搭配使用,在撰寫程式碼時取得即時建議。 JupyterLab CodeWhisperer 可以完成您的註解、完成單行程式碼、 line-by-line 提出建議,以及產生完整格式的函數。

  • 使用 Flink 縮短作業重新啟動時間:使用 Amazon EMR 6.15.0 及更高版本時,Apache Flink 可以使用多種新機制,以改善任務復原或擴展操作期間的作業重新啟動時間。這樣可以優化復原和重新開始執行圖形的速度,以改善作業穩定性。

  • 開放式表格格式的表格層級和精細化存取控制 — 使用 Amazon EMR 6.15.0 及更高版本,當您在存取 AWS Glue 資料目錄中資料的 EC2 叢集上執行 Amazon EMR 上的 Spark 任務時,您可以使用 AWS Lake Formation 在 Hudi、Iceberg 或 Delta 湖上套用表格、列、欄和儲存格層級許可。

  • Hadoop 升級:Amazon EMR 6.15.0 包含將 Apache Hadoop 升級至 3.3.6 版。Hadoop 3.3.6 是在 Amazon EMR 6.15 部署時的最新版本,由 Apache 於 2023 年 6 月發行。Amazon EMR 的先前版本 (6.9.0 到 6.14.x) 使用 Hadoop 3.3.3。

    此升級包括數百個改善和修正,以及包括可重新設定的資料節點參數的功能,用於在所有即時資料節點上啟動批量重新設定操作的 DFSAdmin 選項,以及允許大量搜尋讀取器以指定多個讀取範圍的具向量 API。Hadoop 3.3.6 還新增對 HDFS API 和對預寫日誌 (WAL) 語義的支援,如此 HBase 就可以在其他儲存系統實作上執行。如需詳細資訊,請參閱 Apache Hadoop 文件中的版本 3.3.43.3.53.3.6 版的變更日誌。

  • Support AWS SDK for Java,第 2 版-Amazon EMR 6.15.0 應用程式可以將 AWS SDK 用於 Java 版本 1.12.5692. 20.160 (如果應用程式支援 v2)。適用於 Java 2.x 的 AWS 開發套件是 1.x 版程式碼庫的主要重新撰寫。它建置在 Java 8+ 上,並新增了數個經常請求的功能。這些包括支援非封鎖 I/O 以及能夠在執行期外掛不同的 HTTP 實作。如需詳細資訊 (包括從適用於 Java 第 1 版的開發套件遷移至第 2 版的遷移指南),請參閱 AWS SDK for Java 第 2 版指南。

變更、強化功能和已解決的問題
  • 為了改善高可用性 EMR 叢集,此版本可讓您連線到使用 IPv6 端點之本機主機上的 Amazon EMR 常駐程式。

  • 此版本可讓 TLS 1.2 與 ZooKeeper 佈建在高可用性叢集的所有主要節點上進行通訊。

  • 此版本改善了主要節點上維護的 ZooKeeper 交易記錄檔的管理,以最大限度地減少記錄檔超出邊界並中斷叢集作業的案例。

  • 此版本使高可用性 EMR 叢集的節點內部通訊更具彈性。此改善可減少引導動作失敗或叢集啟動失敗的可能性。

  • Amazon EMR 6.15.0 中的 Tez 引入您可以指定在 Tez 分組分割中非同步開啟輸入分割的組態。當單一 Tez 分組分割中有大量輸入分割時,這有助於改善讀取查詢的效能。如需詳細資訊,請參閱 Tez 非同步分割開啟

  • 當您使用 Amazon EMR 5.36 或更高版本、6.6 或更高版本或 7.0 或更高版本的最新修補程式版本啟動叢集時,Amazon EMR 會使用最新的 Amazon Linux 2023 或 Amazon Linux 2 版本作為預設的 Amazon EMR AMI。如需詳細資訊,請參閱使用預設 Amazon Linux AMI for Amazon EMR

    OsReleaseLabel (Amazon Linux 版本) Amazon Linux 核心版本 可用日期 支援地區
    2.0.20240223.0 4.14.336 2024年3月8日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (阿聯酋)、加拿大 (中部)、以色列 (特拉維夫)、 AWS GovCloud (美國西部)、 AWS GovCloud (美國東部)、中國 (北京)、中國 (寧夏)、加拿大西部 (卡加利)
    2.0.20240131.0 4.14.336 2024年2月14日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (阿聯酋)、加拿大 (中部)、以色列 (特拉維夫)、 AWS GovCloud (美國西部)、 AWS GovCloud (美國東部)、中國 (北京)、中國 (寧夏)、加拿大西部 (卡加利)
    2.0.20240124.0 4.14.336 2024年2月7日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (阿聯酋)、加拿大 (中部)、以色列 (特拉維夫)、 AWS GovCloud (美國西部)、 AWS GovCloud (美國東部)、中國 (北京)、中國 (寧夏)、加拿大西部 (卡加利)
    2.0.20240109.0 4.14.334 2024年1月24日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (阿聯酋)、加拿大 (中部)、以色列 (特拉維夫)、 AWS GovCloud (美國西部)、 AWS GovCloud (美國東部)、中國 (北京)、中國 (寧夏)、加拿大西部 (卡加利)
    2.0.20231218.0 4.14.330 2024年1月2日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (阿聯酋)、加拿大 (中部)、以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏)
    2.0.20231206.0 4.14.330 2023 年 12 月 22 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (阿聯酋)、加拿大 (中部)、以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏)
    2.0.20231116.0 4.14.328 2023 年 12 月 11 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (阿聯酋)、加拿大 (中部)、以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏)
    2.0.20231101.0 4.14.327 2023 年 11 月 13 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (阿聯酋)、加拿大 (中部)、以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏)

6.15.0 預設 Java 版本

Amazon EMR 版本 6.12.0 及更高版本依預設支援所有使用 Amazon Corretto 8 的應用程式,Trino 除外。對於 Trino,從 Amazon EMR 6.9.0 版開始,Amazon EMR 預設支援 Amazon Corretto 17。Amazon EMR 還支援一些使用 Amazon Corretto 11 和 17 的應用程式。下表列出了這些應用程式。如果您想要變更叢集上的預設 JVM,請遵循 設定應用程式以使用特定 Java 虛擬機器 中的說明對在叢集上執行的每個應用程式進行操作。您只能對每個叢集使用一個 Java 執行期版本。Amazon EMR 不支援在相同叢集的不同執行期版本上執行不同的節點或應用程式。

雖然 Amazon EMR 同時支援 Apache Spark、Apache Hadoop 和 Apache Hive 上的 Amazon Corretto 11 與 17,一些工作負載的性能可能會在您使用這些版本的 Corretto 時發生迴歸。建議您在變更預設值前測試您的工作負載。

以下表格顯示 Amazon EMR 6.15.0 中應用程式的預設 Java 版本:

應用程式 Java/Amazon Corretto 版本 (預設為粗體)
Delta 十一
Flink
Ganglia 8
HBase
HCatalog 十一
Hadoop 十一
Hive 十一
Hudi 十一
Iceberg 十一
Livy 十一
Oozie 十一
Phoenix 8
PrestoDB 8
Spark 十一
Spark RAPIDS 十一
Sqoop 8
Tez 十一
Trino 17
Zeppelin 8
Pig 8
Zookeeper 8

6.15.0 元件版本

Amazon EMR 在此版本安裝的元件列出如下。其中有一些屬於大數據應用程式套件。其他的則為 Amazon EMR 獨有,並安裝為系統程序和功能。這些通常會以 emraws 開頭。在最新 Amazon EMR 版本中的大數據應用程式套件,通常也是社群中可找到的最新版本。我們致力盡快提供 Amazon EMR 的社群版本。

Amazon EMR 中的某些元件與社群版本不同。這些元件具有版本標籤,格式為 CommunityVersion-amzn-EmrVersionEmrVersion 從 0 開始。例如,假設有一個名為 myapp-component 的開放原始碼社群元件 2.2 版為了包含在不同 Amazon EMR 發行版本中而修改過三次,則其發行版本會列為 2.2-amzn-2

元件 版本 描述
aws-sagemaker-spark-sdk1.4.2Amazon SageMaker 星火 SDK
delta2.4.0Delta Lake 是一種適用於大型分析資料集的開放式資料表格式
delta-standalone-connectors0.6.0Delta 連接器提供不同的執行期,以便整合 Delta Lake 與 Flink、Hive 和 Presto 等引擎。
emr-ddb5.2.0適用於 Hadoop 生態系統應用程式的 Amazon DynamoDB 連接器。
emr-goodies3.8.0適用 Hadoop 生態系統的超便利程式庫。
emr-kinesis3.12.0適用於 Hadoop 生態系統應用程式的 Amazon Kinesis 連接器。
emr-notebook-env1.7.0適用於 emr 筆記本的 Conda env,前者包含 Jupyter Enterprise Gateway
emr-s3-dist-cp2.29.0針對 Amazon S3 最佳化的分散式複製應用程式。
emr-s3-select2.8.0EMR S3Select Connector
emr-wal-cli1.2.0適用於 emrwal list/deletion 的 Cli。
emrfs2.60.0適用於 Hadoop 生態系統應用程式的 Amazon S3 連接器。
flink-client1.17.1-amzn-1Apache Flink 命令列用戶端指令碼和應用程式。
flink-jobmanager-config1.17.1-amzn-1管理阿帕奇 F JobManager link 的 EMR 節點上的資源。
ganglia-monitor3.7.2Hadoop 生態系統應用程式內嵌 Ganglia 代理程式以及 Ganglia 監控代理程式。
ganglia-metadata-collector3.7.2Ganglia 監控代理程式的彙總指標 Ganglia 中繼資料收集器。
ganglia-web3.7.1由 Ganglia 中繼資料收集器收集,以檢視指標的 Web 應用程式。
hadoop-client3.3.6-amzn-1Hadoop 命令列用戶端,例如「hdfs」、「Hadoop」或「yarn」。
hadoop-hdfs-datanode3.3.6-amzn-1用於存放區塊的 HDFS 節點層級服務。
hadoop-hdfs-library3.3.6-amzn-1HDFS 命令列用戶端和程式庫
hadoop-hdfs-namenode3.3.6-amzn-1用於追蹤檔案名稱和區塊位置的 HDFS 服務。
hadoop-hdfs-journalnode3.3.6-amzn-1HDFS 檔案系統中的 Hadoop 服務,用於管理在 HA 叢集。
hadoop-httpfs-server3.3.6-amzn-1HDFS 操作的 HTTP 端點。
hadoop-kms-server3.3.6-amzn-1基於 Hadoop 的 KeyProvider API 的加密密鑰管理服務器。
hadoop-mapred3.3.6-amzn-1MapReduce 用於執行應用程式的執行引擎 MapReduce 程式庫。
hadoop-yarn-nodemanager3.3.6-amzn-1在個別節點用於管理容器的 YARN 服務。
hadoop-yarn-resourcemanager3.3.6-amzn-1用於分配和管理叢集資源,以及分散式應用程式的 YARN 服務。
hadoop-yarn-timeline-server3.3.6-amzn-1為 YARN 應用程式擷取目前和歷史資訊的服務。
hbase-hmaster2.4.17-amzn-3負責區域協調和執行管理命令的 HBase 叢集服務。
hbase-region-server2.4.17-amzn-3提供一或多個 HBase 區域的服務。
hbase-client2.4.17-amzn-3HBase 命令列用戶端。
hbase-rest-server2.4.17-amzn-3為 HBase 提供 RESTful HTTP 端點的服務。
hbase-thrift-server2.4.17-amzn-3提供 Thrift 端點到 HBase 的服務。
hbase-operator-tools2.4.17-amzn-3適用於 Apache HBase 叢集的修復工具。
hcatalog-client3.1.3-amzn-8操作 hcatalog-server 的「hcat」命令列用戶端。
hcatalog-server3.1.3-amzn-8服務為分散式應用程式提供 HCatalog、表格和儲存管理層。
hcatalog-webhcat-server3.1.3-amzn-8HTTP 端點提供了 REST 介面至 HCatalog。
hive-client3.1.3-amzn-8Hive 命令列用戶端。
hive-hbase3.1.3-amzn-8Hive-hbase 用戶端。
hive-metastore-server3.1.3-amzn-8為 Hadoop 操作的 SQL 提供存取 Hive 中繼儲存、存放中繼資料語意儲存庫的服務。
hive-server23.1.3-amzn-8依 Web 請求接受 Hive 查詢的服務。
hudi0.14.0-amzn-0增量處理架構,以低延遲和高效率強化資料管道。
hudi-presto0.14.0-amzn-0用於使用 Hudi 執行 Presto 的套件程式庫。
hudi-trino0.14.0-amzn-0用於使用 Hudi 執行 Trino 的套件程式庫。
hudi-spark0.14.0-amzn-0用於使用 Hudi 執行 Spark 的套件程式庫。
hue-server4.11.0使用 Hadoop 生態系統應用程式分析資料的 Web 應用程式
iceberg1.4.0-amzn-0Apache Iceberg 是一種適用於大型分析資料集的開放式資料表格式
jupyterhub1.5.0適用於 Jupyter 筆記本的多使用者伺服器
livy-server0.7.1-incubating與 Apache Spark 互動的 REST 介面
nginx1.12.1nginx [engine x] 是 HTTP 和反向代理伺服器
mxnet1.9.1靈活有效率的程式庫,具可擴展性,適用於深度學習。
mariadb-server5.68+MariaDB 資料庫伺服器。
nvidia-cuda11.8.0Nvidia 驅動程式和 Cuda 工具組
oozie-client5.2.1Oozie 命令列用戶端。
oozie-server5.2.1接受 Oozie 工作流程要求的服務。
opencv4.7.0開放原始碼電腦 Vision 程式庫。
phoenix-library5.1.3適用於伺服器和用戶端的 phoenix 程式庫
phoenix-connectors5.1.3適用於 Spark-3 的 Apache Phoenix 連接器
phoenix-query-server5.1.3此為一輕量伺服器,可提供對 Avatica API 的 JDBC 存取以及通訊協定緩衝區和 JSON 格式存取
presto-coordinator0.283-amzn-0在 presto-workers 之間接受查詢和執行管理查詢的服務。
presto-worker0.283-amzn-0執行查詢各部分的服務。
presto-client0.283-amzn-0安裝於 HA 叢集的待命主節點的 Presto 命令列用戶端,該主節點上的 Presto 伺服器未啟動。
trino-coordinator426-amzn-0在 trino-workers 之間接受查詢和執行管理查詢的服務。
trino-worker426-amzn-0執行查詢各部分的服務。
trino-client426-amzn-0安裝於 HA 叢集的待命主節點的 Trino 命令列用戶端,該主節點上的 Trino 伺服器未啟動。
pig-client0.17.0Pig 命令列用戶端。
r4.0.2統計運算 R 專案
ranger-kms-server2.0.0Apache Ranger Key Management System
spark-client3.4.1-amzn-2Spark 命令列用戶端。
spark-history-server3.4.1-amzn-2用於檢視完整 Spark 應用程式生命週期記錄事件的 Web 使用者介面。
spark-on-yarn3.4.1-amzn-2適用於 YARN 的記憶體內執行引擎。
spark-yarn-slave3.4.1-amzn-2YARN 從屬所需的 Apache Spark 程式庫。
spark-rapids23.08.1-amzn-0Nvidia Spark RAPIDS 外掛程式使用 GPU 加速 Apache Spark。
sqoop-client1.4.7Apache Sqoop 命令列用戶端。
tensorflow2.11.0TensorFlow 用於高性能數值計算的開源軟件庫。
tez-on-yarn0.10.2-amzn-6tez YARN 應用程式和程式庫。
tez-on-worker0.10.2-amzn-6適用於工作節點的 tez YARN 應用程式和程式庫。
webserver2.4.41+Apache HTTP 伺服器。
zeppelin-server0.10.1能進行互動式資料分析,以 Web 為基礎的筆記型電腦。
zookeeper-server3.5.10用於維護組態資訊、命名、提供分散式同步,並提供群組服務的集中化服務。
zookeeper-client3.5.10ZooKeeper 命令行客戶端。

6.15.0 組態類別

組態分類可讓您自訂應用程式。這些檔案通常對應於應用程式的組態 XML 檔案,例如 hive-site.xml。如需詳細資訊,請參閱 設定應用程式

當您為執行中叢集的執行個體群組指定組態時,就會發生重新設定動作。Amazon EMR 只會為您修改的分類啟動重新設定動作。如需詳細資訊,請參閱 重新設定執行中叢集中的執行個體群組

emr-6.15.0 類別
分類 描述 重新設定動作

capacity-scheduler

變更 Hadoop 中 capacity-scheduler.xml 檔案的值。

Restarts the ResourceManager service.

container-executor

在 Hadoop YARN 的 container-executor.cfg 檔案中變更值。

Not available.

container-log4j

變更 Hadoop YARN 的 container-log4j.properties 檔案中的值。

Not available.

core-site

變更 Hadoop 中 core-site.xml 檔案的值。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Ranger KMS, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer.

docker-conf

變更 Docker 相關設定。

Not available.

emrfs-site

變更 EMRFS 設定。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts HBaseRegionserver, HBaseMaster, HBaseThrift, HBaseRest, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer.

flink-conf

變更 flink-conf.yaml 設定。

Restarts Flink history server.

flink-log4j

變更 Flink log4j.properties 設定。

Restarts Flink history server.

flink-log4j-session

變更 Kubernetes/Yarn 工作階段的 Flink log4j-session.properties 設定。

Restarts Flink history server.

flink-log4j-cli

變更 Flink log4j-cli.properties 設定。

Restarts Flink history server.

hadoop-env

在 Hadoop 環境中變更所有 Hadoop 元件的值。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts PhoenixQueryserver, HiveServer2, Hive MetaStore, and MapReduce-HistoryServer.

hadoop-log4j

變更 Hadoop 中 log4j.properties 檔案的值。

Restarts the Hadoop HDFS services SecondaryNamenode, Datanode, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Hadoop Httpfs, and MapReduce-HistoryServer.

hadoop-ssl-server

變更 hadoop ssl 伺服器組態

Not available.

hadoop-ssl-client

變更 hadoop ssl 用戶端組態

Not available.

hbase

Apache HBase 的 Amazon EMR 彙整設定。

Custom EMR specific property. Sets emrfs-site and hbase-site configs. See those for their associated restarts.

hbase-env

變更 HBase 環境中的值。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-log4j

變更 HBase 的 hbase-log4j.properties 檔案中的值。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-metrics

變更 HBase 的 hadoop-metrics2-hbase.properties 檔案中的值。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-policy

變更 HBase 的 hbase-policy.xml 檔案中的值。

Not available.

hbase-site

變更 HBase 的 hbase-site.xml 檔案中的值。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer. Additionally restarts Phoenix QueryServer.

hdfs-encryption-zones

設定 HDFS 加密區域。

This classification should not be reconfigured.

hdfs-env

變更 HDFS 環境中的值。

Restarts Hadoop HDFS services Namenode, Datanode, and ZKFC.

hdfs-site

變更 HDFS 的 hdfs-site.xml 中的值。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Additionally restarts Hadoop Httpfs.

hcatalog-env

變更 HCatalog 環境中的值。

Restarts Hive HCatalog Server.

hcatalog-server-jndi

變更 HCatalog 的 jndi.properties 中的值。

Restarts Hive HCatalog Server.

hcatalog-server-proto-hive-site

更改 H 目錄的 proto-hive-site .xml 中的值。

Restarts Hive HCatalog Server.

hcatalog-webhcat-env

變更 HCatalog WebHCat 環境中的值。

Restarts Hive WebHCat server.

hcatalog-webhcat-log4j2

變更 HCatalog WebHCat 的 log4j2.properties 中的值。

Restarts Hive WebHCat server.

hcatalog-webhcat-site

變更 HCatalog WebHCat 的 webhcat-site.xml 檔案中的值。

Restarts Hive WebHCat server.

hive

Apache Hive 的 Amazon EMR 彙整設定。

Sets configurations to launch Hive LLAP service.

hive-beeline-log4j2

變更 Hive 的 beeline-log4j2.properties 檔案中的值。

Not available.

hive-parquet-logging

變更 Hive 的 parquet-logging.properties 檔案中的值。

Not available.

hive-env

變更 Hive 環境中的值。

Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore.

hive-exec-log4j2

更改蜂巢的 hive-exec-log 4j2. 屬性文件中的值。

Not available.

hive-llap-daemon-log4j2

更改蜂巢的 llap-daemon-log 4j2. 屬性文件中的值。

Not available.

hive-log4j2

變更 Hive 的 hive-log4j2.properties 檔案中的值。

Not available.

hive-site

變更 Hive 的 hive-site.xml 檔案中的值

Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore. Also restarts Oozie and Zeppelin.

hiveserver2-site

變更 Hive Server2 的 hiveserver2-site.xml 檔案中的值

Not available.

hue-ini

變更 Hue 的 ini 檔案中的值

Restarts Hue. Also activates Hue config override CLI commands to pick up new configurations.

httpfs-env

變更 HTTPFS 環境中的值。

Restarts Hadoop Httpfs service.

httpfs-site

變更 Hadoop 中 httpfs-site.xml 檔案的值。

Restarts Hadoop Httpfs service.

hadoop-kms-acls

變更 Hadoop 中 kms-acls.xml 檔案的值。

Not available.

hadoop-kms-env

變更 Hadoop KMS 環境中的值。

Restarts Hadoop-KMS service.

hadoop-kms-java-home

變更 Hadoop 的 KMS Java Home

Not available.

hadoop-kms-log4j

變更 Hadoop 的 kms-log4j.properties 檔案中的值。

Not available.

hadoop-kms-site

變更 Hadoop 中 kms-site.xml 檔案的值。

Restarts Hadoop-KMS and Ranger-KMS service.

hudi-env

變更 Hudi 環境中的值。

Not available.

hudi-defaults

變更 Hudi 的 hudi-defaults.conf 檔案中的值。

Not available.

iceberg-defaults

變更 Iceberg 的 iceberg-defaults.conf 檔案中的值。

Not available.

delta-defaults

變更 Delta 的 delta-defaults.conf 檔案中的值。

Not available.

jupyter-notebook-conf

變更 Jupyter 筆記本中 jupyter_notebook_config.py 檔案的值。

Not available.

jupyter-hub-conf

變更 JupyterHubs的 jupyterhub_config.py 檔案中的值。

Not available.

jupyter-s3-conf

設定 Jupyter 筆記本 S3 持久性。

Not available.

jupyter-sparkmagic-conf

變更 Sparkmagic 中 config.json 檔案的值。

Not available.

livy-conf

變更 Livy 的 livy.conf 檔案中的值。

Restarts Livy Server.

livy-env

變更 Livy 環境中的值。

Restarts Livy Server.

livy-log4j2

變更 Livy log4j2.properties 設定。

Restarts Livy Server.

mapred-env

變更 MapReduce 應用程式環境中的值。

Restarts Hadoop MapReduce-HistoryServer.

mapred-site

變更 MapReduce 應用程式的 mapred-site.xml 檔案中的值。

Restarts Hadoop MapReduce-HistoryServer.

oozie-env

變更 Oozie 環境中的值。

Restarts Oozie.

oozie-log4j

變更 Oozie 的 oozie-log4j.properties 檔案中的值。

Restarts Oozie.

oozie-site

變更 Oozie 的 oozie-site.xml 檔案中的值。

Restarts Oozie.

phoenix-hbase-metrics

變更 Phoenix 的 hadoop-metrics2-hbase.properties 檔案中的值。

Not available.

phoenix-hbase-site

變更 Phoenix 的 hbase-site.xml 檔案中的值。

Not available.

phoenix-log4j

變更 Phoenix 中 log4j.properties 檔案的值。

Restarts Phoenix-QueryServer.

phoenix-metrics

變更 Phoenix 的 hadoop-metrics2-phoenix.properties 檔案中的值。

Not available.

pig-env

在 Pig 環境中變更值。

Not available.

pig-properties

變更 Pig 的 pig.properties 檔案中的值。

Restarts Oozie.

pig-log4j

變更 Pig 的 log4j.properties 檔案中的值。

Not available.

presto-log

變更 Presto 的 log.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-config

變更 Presto 的 config.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-password-authenticator

變更 Presto 的 password-authenticator.properties 檔案中的值。

Not available.

presto-env

變更 Presto 的 presto-env.sh 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-node

變更 Presto 的 node.properties 檔案中的值。

Not available.

presto-connector-blackhole

變更 Presto 的 blackhole.properties 檔案中的值。

Not available.

presto-connector-cassandra

變更 Presto 的 cassandra.properties 檔案中的值。

Not available.

presto-connector-hive

變更 Presto 的 hive.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-connector-jmx

變更 Presto 的 jmx.properties 檔案中的值。

Not available.

presto-connector-kafka

變更 Presto 的 kafka.properties 檔案中的值。

Not available.

presto-connector-lakeformation

變更 Presto 的 lakeformation.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-connector-localfile

變更 Presto 的 localfile.properties 檔案中的值。

Not available.

presto-connector-memory

變更 Presto 的 memory.properties 檔案中的值。

Not available.

presto-connector-mongodb

變更 Presto 的 mongodb.properties 檔案中的值。

Not available.

presto-connector-mysql

變更 Presto 的 mysql.properties 檔案中的值。

Not available.

presto-connector-postgresql

變更 Presto 的 postgresql.properties 檔案中的值。

Not available.

presto-connector-raptor

變更 Presto 的 raptor.properties 檔案中的值。

Not available.

presto-connector-redis

變更 Presto 的 redis.properties 檔案中的值。

Not available.

presto-connector-redshift

變更 Presto 的 redshift.properties 檔案中的值。

Not available.

presto-connector-tpch

變更 Presto 的 tpch.properties 檔案中的值。

Not available.

presto-connector-tpcds

變更 Presto 的 tpcds.properties 檔案中的值。

Not available.

trino-log

變更 Trino 的 log.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-config

變更 Trino 的 config.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-password-authenticator

變更 Trino 的 password-authenticator.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-env

變更 Trino 的 trino-env.sh 檔案中的值。

Restarts Trino-Server (for Trino)

trino-node

變更 Trino 的 node.properties 檔案中的值。

Not available.

trino-connector-blackhole

變更 Trino 的 blackhole.properties 檔案中的值。

Not available.

trino-connector-cassandra

變更 Trino 的 cassandra.properties 檔案中的值。

Not available.

trino-connector-delta

變更 Trino 的 delta.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-hive

變更 Trino 的 hive.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-exchange-manager

變更 Trino 的 exchange-manager.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-iceberg

變更 Trino 的 iceberg.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-hudi

變更 Trino 的 hudi.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-jmx

變更 Trino 的 jmx.properties 檔案中的值。

Not available.

trino-connector-kafka

變更 Trino 的 kafka.properties 檔案中的值。

Not available.

trino-connector-localfile

變更 Trino 的 localfile.properties 檔案中的值。

Not available.

trino-connector-memory

變更 Trino 的 memory.properties 檔案中的值。

Not available.

trino-connector-mongodb

變更 Trino 的 mongodb.properties 檔案中的值。

Not available.

trino-connector-mysql

變更 Trino 的 mysql.properties 檔案中的值。

Not available.

trino-connector-postgresql

變更 Trino 的 postgresql.properties 檔案中的值。

Not available.

trino-connector-raptor

變更 Trino 的 raptor.properties 檔案中的值。

Not available.

trino-connector-redis

變更 Trino 的 redis.properties 檔案中的值。

Not available.

trino-connector-redshift

變更 Trino 的 redshift.properties 檔案中的值。

Not available.

trino-connector-tpch

變更 Trino 的 tpch.properties 檔案中的值。

Not available.

trino-connector-tpcds

變更 Trino 的 tpcds.properties 檔案中的值。

Not available.

ranger-kms-dbks-site

變更 Ranger KMS 之 dbks-site.xml 檔案中的值。

Restarts Ranger KMS Server.

ranger-kms-site

更改遊俠 KMS 的 ranger-kms-site .xml 文件中的值。

Restarts Ranger KMS Server.

ranger-kms-env

變更 Ranger KMS 環境中的值。

Restarts Ranger KMS Server.

ranger-kms-logback

變更 Ranger KMS 的 kms-logback.xml 檔案中的值。

Not available.

ranger-kms-db-ca

變更 S3 上 CA 檔案的值,以使用 Ranger KMS 進行 MySQL SSL 連線。

Not available.

spark

Apache Spark 的 Amazon EMR 彙整設定。

This property modifies spark-defaults. See actions there.

spark-defaults

變更 Spark 的 spark-defaults.conf 檔案中的值。

Restarts Spark history server and Spark thrift server.

spark-env

變更 Spark 環境中的值。

Restarts Spark history server and Spark thrift server.

spark-hive-site

變更 Spark 的 hive-site.xml 檔案中的值

Not available.

spark-log4j2

變更 Spark 中 log4j2.properties 檔案中的值。

Restarts Spark history server and Spark thrift server.

spark-metrics

變更 Spark 中 metrics.properties 檔案的值。

Restarts Spark history server and Spark thrift server.

sqoop-env

變更 Sqoop 環境中的值。

Not available.

sqoop-oraoop-site

在方向 OraOop的 oraoop-site.xml 文件中更改值。

Not available.

sqoop-site

變更 Sqoop 的 sqoop-site.xml 檔案中的值。

Not available.

tez-site

變更 Tez 的 tez-site.xml 檔案中的值。

Restart Oozie and HiveServer2.

yarn-env

變更 YARN 環境中的值。

Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts MapReduce-HistoryServer.

yarn-site

變更 YARN 的 yarn-site.xml 檔案中的值。

Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Livy Server and MapReduce-HistoryServer.

zeppelin-env

變更 Zeppelin 環境中的值。

Restarts Zeppelin.

zeppelin-site

變更 zeppelin-site.xml 中的組態設定。

Restarts Zeppelin.

zookeeper-config

變更 ZooKeeper的 zoo.cfg 檔案中的值。

Restarts Zookeeper server.

zookeeper-log4j

變更 log4j. 屬性 ZooKeeper檔案中的值。

Restarts Zookeeper server.

6.15.0 變更日誌

6.15.0 版本和版本備註的變更日誌
日期 事件 描述
2023-11-17 文件出版 Amazon EMR 6.15.0 版本備註首次發布

2023-11-17

部署完成 Amazon EMR 6.15.0 完全部署到所有支援的區域
2023-11-13 初始版本 Amazon EMR 6.15.0 首次部署至初始的商業區域