本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon EMR 7.3.0 版
7.3.0 支援的生命週期
下表說明 Amazon EMR 7.3.0 版支援的生命週期日期。
支援階段 | 日期 |
---|---|
初始發行日期 | 2024 年 10 月 16 日 |
標準 支援,直到 | 2026 年 10 月 15 日 |
終止支援 | 2026 年 10 月 16 日 |
生命週期結束 | 2027 年 10 月 16 日 |
如需在建議的軟體和組態下不會影響 EMR 叢集的關鍵和高常見漏洞和暴露 (CVEs) 清單,請參閱 7.3.0 核心引擎的已知常見漏洞和暴露。
7.3.0 發行元件
Amazon EMR 7.3.0 包含下列應用程式:
核心引擎:
AmazonCloudWatchAgent,Delta。Flink、Hadoop、HBase、HCatalog、Hive、Hudi、Livy、Iceberg、JupyterEnterpriseGateway、Phoenix、Spark、Tez、Trino、Zookeeper
額外項目:
Hue、JupyterHub、Oozie、Pig、Presto、Sqoop、TensorFlow、Zeppelin
如需包含套件的詳細資訊,請參閱 Amazon EMR 7.x 版本中的應用程式版本。如需核心引擎和其他項目的詳細資訊,請參閱 Amazon EMR 標準支援。
7.3.0 應用程式版本
此版本包含下列應用程式:AmazonCloudWatchAgent、Delta
下表列出此 Amazon EMR 版本中提供的應用程式版本,以及前三個 Amazon EMR 版本 (如果適用) 中的應用程式版本。
如需完整了解各 Amazon EMR 版之應用程式版本的完整歷史記錄,請參閱以下主題:
emr-7.3.0 | emr-7.2.0 | emr-7.1.0 | emr-7.0.0 | |
---|---|---|---|---|
AWS 適用於 Java 的開發套件 | 2.25.70,1.12.747 | 2.23.18,1.12.705 | 2.23.18、1.12.656 | 2.20.160-amzn-0、1.12.569 |
Python | 3.9、3.11 | 3.9、3.11 | 3.9、3.11 | 3.9 |
Scala | 2.12.18 | 2.12.17 | 2.12.17 | 2.12.17 |
AmazonCloudWatchAgent | 1.300032.2 | 1.300032.2 | 1.300032.2 | 1.300031.1 |
Delta | 3.2.0-amzn-0 | 3.1.0 | 3.0.0 | 3.0.0 |
Flink | 1.18.1 | 1.18.1 | 1.18.1 | 1.18.0 |
Ganglia | - | - | - | - |
HBase | 2.4.17 | 2.4.17 | 2.4.17 | 2.4.17 |
HCatalog | 3.1.3 | 3.1.3 | 3.1.3 | 3.1.3 |
Hadoop | 3.3.6 | 3.3.6 | 3.3.6 | 3.3.6 |
Hive | 3.1.3 | 3.1.3 | 3.1.3 | 3.1.3 |
Hudi | 0.15.0-amzn-0 | 0.14.1-amzn-1 | 0.14.1-amzn-0 | 0.14.0-amzn-1 |
Hue | 4.11.0 | 4.11.0 | 4.11.0 | 4.11.0 |
Iceberg | 1.5.2-amzn-0 | 1.5.0-amzn-0 | 1.4.3-amzn-0 | 1.4.2-amzn-0 |
JupyterEnterpriseGateway | 2.6.0 | 2.6.0 | 2.6.0 | 2.6.0 |
JupyterHub | 1.5.0 | 1.5.0 | 1.5.0 | 1.5.0 |
Livy | 0.8.0 | 0.8.0 | 0.8.0 | 0.7.1 |
MXNet | - | 1.9.1 | 1.9.1 | 1.9.1 |
Mahout | - | - | - | - |
Oozie | 5.2.1 | 5.2.1 | 5.2.1 | 5.2.1 |
Phoenix | 5.1.3 | 5.1.3 | 5.1.3 | 5.1.3 |
Pig | 0.17.0 | 0.17.0 | 0.17.0 | 0.17.0 |
Presto | 0.285 | 0.285 | 0.284 | 0.283 |
Spark | 3.5.1 | 3.5.1 | 3.5.0 | 3.5.0 |
Sqoop | 1.4.7 | 1.4.7 | 1.4.7 | 1.4.7 |
TensorFlow | 2.16.1 | 2.11.0 | 2.11.0 | 2.11.0 |
Tez | 0.10.2 | 0.10.2 | 0.10.2 | 0.10.2 |
Trino (PrestoSQL) | 442 | 436 | 435 | 426 |
Zeppelin | 0.11.1 | 0.10.1 | 0.10.1 | 0.10.1 |
ZooKeeper | 3.9.1 | 3.9.1 | 3.9.1 | 3.5.10 |
7.3.0 版本備註
下列版本備註包含 Amazon EMR 7.3.0 版的資訊。變更是相對於 7.3.0。
新功能
-
應用程式升級:Amazon EMR 7.3.0 application upgrades include Delta 3.2.0-amzn-0, Hudi 0.15.0-amzn-0, TensorFlow 2.16.1, Trino 442, and Zeppelin 0.11.1。
-
此版本新增 22 個開放原始碼端點,支援透過網路傳輸中加密。這項改善包括開放原始碼架構,例如 Hadoop、Hive、Tez、HBase、Phoenix 和 Flink。如果您已啟用傳輸中加密,並想要連線到這些端點,您可能需要修改程式碼以支援 TLS 通訊。您可以視需要停用這些端點的 TLS。如需支援端點的完整清單,請參閱了解傳輸中加密。
-
使用 Amazon EMR 7.3.0,Apache Hive with Iceberg 現在支援 AWS Glue Data Catalog 作為中繼存放區,這可讓您受益,例如集中式儲存庫來存放中繼資料、自動爬取資料來源和擷取中繼資料,以及與其他 服務整合,以實現無縫工作流程。
已知問題
-
EMR Studio 不支援 Python 3.11。
-
如果您使用傳輸中加密和 Kerberos 身分驗證,您將無法使用依賴 Hive 中繼存放區的 Spark 應用程式。此問題在 HIVE-16340
中已修正,當開放原始碼 Spark 可以升級至 Hive 3 時,將在 SPARK-44114 中完全解決。同時,您可以將 hive.metastore.use.SSL
設定為 ,暫時解決此問題false
。如需詳細資訊,請參閱設定應用程式。-
如果您不使用 Kerberos 身分驗證,則必須將 Spark 設定為使用 SSL。若要這麼做,請在佈建叢集時設定下列組態。
[{ "Classification": "spark-defaults", "Properties": { "spark.hadoop.hive.metastore.truststore.path": "/usr/share/aws/emr/security/conf/keystore-thrift.jks", "spark.hadoop.hive.metastore.use.SSL": "true" } }]
-
-
如果您使用自訂網域,則 AWS 主控台 Spark 歷史記錄伺服器使用者介面中的某些連結可能無法運作。將下列指令碼上傳至 S3 儲存貯體,然後新增步驟以使用 shell 指令碼。
#!/bin/bash if grep -q ":8042" /etc/nginx/nginx.conf; then sudo sed -i '=s#\^(\\/nm\\/(?<nodeAddress>.*:8042)\\/(?<url>.*)\$)#^(\\/nm\\/(?<nodeAddress>(\\.|-|[a-zA-Z0-9])*:8042)\\/(?<url>(node|conf|logs|stacks|jmx).*)\$)#g' /etc/nginx/nginx.conf else sudo sed -i 's#\^(\\/nm\\/(?<nodeAddress>.*:8044)\\/(?<url>.*)\$)#^(\\/nm\\/(?<nodeAddress>(\\.|-|[a-zA-Z0-9])*:8044)\\/(?<url>(node|conf|logs|stacks|jmx).*)\$)#g' /etc/nginx/nginx.conf fi sudo systemctl restart nginx
變更、強化功能和已解決的問題
-
為了支援 YARN 的 TLS 主機名稱驗證,此版本會將
yarn.resourcemanager.hostname
組態從主要執行個體 IP 地址變更為主要執行個體私有 DNS 名稱。 -
MXNet 專案
已達到生命週期結束,現已封存。 Amazon EMR 7.2.0 版是包含 MXNet 的最後一個版本。
當您啟動具有 Amazon EMR 5.36 或更高版本、6.6 或更高版本,或 7.0 或更高版本的叢集時,Amazon EMR 會使用預設 Amazon EMR AMI 的最新 Amazon Linux 2023 或 Amazon Linux 2 版本。如需詳細資訊,請參閱使用預設 Amazon Linux AMI for Amazon EMR。
OsReleaseLabel (Amazon Linux 版本) Amazon Linux 核心版本 可用日期 支援地區 2023 年 6 月 2025 年 123 月 4 日 6.1.124-134.200.amzn2023 2025 年 1 月 27 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利佛尼亞北部), 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (法蘭克福)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港), 亞太區域 (孟買)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達), 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林), 加拿大 (中部)、 AWS GovCloud (美國西部)、 AWS GovCloud (美國東部)、 中國 (北京)、 中國 (寧夏)、 亞太區域 (海德拉巴)、 中東 (阿拉伯聯合大公國), 歐洲 (西班牙)、 歐洲 (蘇黎世)、 亞太區域 (墨爾本)、 以色列 (特拉維夫)、 加拿大西部 (卡加利) 2023 年 6 月 2025 年 115 月 0 日 6.1.119-129.201.amzn2023 2025 年 1 月 23 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利佛尼亞北部), 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (法蘭克福)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港), 亞太區域 (孟買)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達), 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林), 加拿大 (中部)、 AWS GovCloud (美國西部)、 AWS GovCloud (美國東部)、 中國 (北京)、 中國 (寧夏)、 亞太區域 (海德拉巴)、 中東 (阿拉伯聯合大公國), 歐洲 (西班牙)、 歐洲 (蘇黎世)、 亞太區域 (墨爾本)、 以色列 (特拉維夫)、 加拿大西部 (卡加利) 2023.6.20241121.0 6.1.115-126.197.amzn2023 2024 年 12 月 12 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利佛尼亞北部), 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (法蘭克福)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港), 亞太區域 (孟買)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達), 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林), 加拿大 (中部)、 AWS GovCloud (美國西部)、 AWS GovCloud (美國東部)、 中國 (北京)、 中國 (寧夏)、 亞太區域 (海德拉巴)、 中東 (阿拉伯聯合大公國), 歐洲 (西班牙)、 歐洲 (蘇黎世)、 亞太區域 (墨爾本)、 以色列 (特拉維夫)、 加拿大西部 (卡加利) 2023 年 6 月 2024 年 1031 月 0 日 6.1.112-124.190.amzn2023 2024 年 11 月 15 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利佛尼亞北部), 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (法蘭克福)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港), 亞太區域 (孟買)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達), 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林), 加拿大 (中部)、 AWS GovCloud (美國西部)、 AWS GovCloud (美國東部)、 中國 (北京)、 中國 (寧夏)、 亞太區域 (海德拉巴)、 中東 (阿拉伯聯合大公國), 歐洲 (西班牙)、 歐洲 (蘇黎世)、 亞太區域 (墨爾本)、 以色列 (特拉維夫)、 加拿大西部 (卡加利) 2023.5.20240916 6.1.109-118.189.amzn2023 2024 年 9 月 6 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利佛尼亞北部), 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (法蘭克福)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港), 亞太區域 (孟買)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達), 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林), 加拿大 (中部)、 AWS GovCloud (美國西部)、 AWS GovCloud (美國東部)、 中國 (北京)、 中國 (寧夏)、 亞太區域 (海德拉巴)、 中東 (阿拉伯聯合大公國), 歐洲 (西班牙)、 歐洲 (蘇黎世)、 亞太區域 (墨爾本)、 以色列 (特拉維夫)、 加拿大西部 (卡加利)
7.3.0 預設 Java 版本
Amazon EMR 7.3 版和更新版本預設隨附 Amazon Corretto 17 (建置於 OpenJDK),適用於支援 Corretto 17 (JDK 17) 的應用程式,但 Apache Livy 除外。
下表顯示 Amazon EMR 7.3.0 中應用程式的預設 Java 版本。如果您想要變更叢集上的預設 JVM,請遵循 設定應用程式以使用特定 Java 虛擬機器 中的說明對在叢集上執行的每個應用程式進行操作。您只能對每個叢集使用一個 Java 執行期版本。Amazon EMR 不支援在相同叢集的不同執行期版本上執行不同的節點或應用程式。
應用程式 | Java/Amazon Corretto 版本 (預設為粗體) |
---|---|
Delta | 17、11、8 |
Flink | 17、11、8 |
HBase | 17、11、8 |
HCatalog | 17、11、8 |
Hadoop | 17、11、8 |
Hive | 17、11、8 |
Hudi | 17、11、8 |
Iceberg | 17、11、8 |
Livy | 17、11、8 |
Oozie | 17、11、8 |
Phoenix | 17、11、8 |
PrestoDB | 8 |
Spark | 17、11、8 |
Spark RAPIDS | 17、11、8 |
Sqoop | 8 |
Tez | 17、11、8 |
Trino | 21、17 |
Zeppelin | 8 |
Pig | 8 |
Zookeeper | 17、11、8 |
7.3.0 元件版本
Amazon EMR 在此版本安裝的元件列出如下。其中有一些屬於大數據應用程式套件。其他的則為 Amazon EMR 獨有,並安裝為系統程序和功能。這些通常會以 emr
或 aws
開頭。在最新 Amazon EMR 版本中的大數據應用程式套件,通常也是社群中可找到的最新版本。我們致力盡快提供 Amazon EMR 的社群版本。
Amazon EMR 中的某些元件與社群版本不同。這些元件具有版本標籤,格式為
。CommunityVersion
-amzn-EmrVersion
從 0 開始。例如,假設有一個名為 EmrVersion
myapp-component
的開放原始碼社群元件 2.2 版為了包含在不同 Amazon EMR 發行版本中而修改過三次,則其發行版本會列為 2.2-amzn-2
。
元件 | 版本 | 描述 |
---|---|---|
adot-java-agent | 1.31.0 | 從應用程式常駐程式收集指標的 Java 代理程式。 |
delta | 3.2.0-amzn-0 | Delta Lake 是一種適用於大型分析資料集的開放式資料表格式 |
emr-amazon-cloudwatch-agent | 1.300032.2-amzn-0 | 從 Amazon EC2 執行個體收集內部系統層級指標和自訂應用程式指標的應用程式。 |
emr-ddb | 5.5.0 | 適用於 Hadoop 生態系統應用程式的 Amazon DynamoDB 連接器。 |
emr-goodies | 3.12.0 | 適用 Hadoop 生態系統的超便利程式庫。 |
emr-kinesis | 3.16.0 | 適用於 Hadoop 生態系統應用程式的 Amazon Kinesis 連接器。 |
emr-notebook-env | 1.16.0 | 適用於 emr 筆記本的 Conda env,前者包含 Jupyter Enterprise Gateway |
emr-s3-dist-cp | 2.33.0 | 針對 Amazon S3 最佳化的分散式複製應用程式。 |
emr-s3-select | 2.12.0 | EMR S3Select Connector |
emr-wal-cli | 1.3.0 | 適用於 emrwal list/deletion 的 Cli。 |
emrfs | 2.64.0 | 適用於 Hadoop 生態系統應用程式的 Amazon S3 連接器。 |
flink-client | 1.18.1-amzn-2 | Apache Flink 命令列用戶端指令碼和應用程式。 |
flink-jobmanager-config | 1.18.1-amzn-2 | 管理 Apache Flink JobManager 的 EMR 節點上的資源。 |
hadoop-client | 3.3.6-amzn-5 | Hadoop 命令列用戶端,例如「hdfs」、「Hadoop」或「yarn」。 |
hadoop-hdfs-datanode | 3.3.6-amzn-5 | 用於存放區塊的 HDFS 節點層級服務。 |
hadoop-hdfs-library | 3.3.6-amzn-5 | HDFS 命令列用戶端和程式庫 |
hadoop-hdfs-namenode | 3.3.6-amzn-5 | 用於追蹤檔案名稱和區塊位置的 HDFS 服務。 |
hadoop-hdfs-journalnode | 3.3.6-amzn-5 | HDFS 檔案系統中的 Hadoop 服務,用於管理在 HA 叢集。 |
hadoop-httpfs-server | 3.3.6-amzn-5 | HDFS 操作的 HTTP 端點。 |
hadoop-kms-server | 3.3.6-amzn-5 | 以 Hadoop 金鑰供應商 API 為基礎的加密金鑰管理伺服器。 |
hadoop-mapred | 3.3.6-amzn-5 | 執行 MapReduce 應用程式的 MapReduce 執行引擎程式庫。 |
hadoop-yarn-nodemanager | 3.3.6-amzn-5 | 在個別節點用於管理容器的 YARN 服務。 |
hadoop-yarn-resourcemanager | 3.3.6-amzn-5 | 用於分配和管理叢集資源,以及分散式應用程式的 YARN 服務。 |
hadoop-yarn-timeline-server | 3.3.6-amzn-5 | 為 YARN 應用程式擷取目前和歷史資訊的服務。 |
hbase-hmaster | 2.4.17-amzn-7 | 負責區域協調和執行管理命令的 HBase 叢集服務。 |
hbase-region-server | 2.4.17-amzn-7 | 提供一或多個 HBase 區域的服務。 |
hbase-client | 2.4.17-amzn-7 | HBase 命令列用戶端。 |
hbase-rest-server | 2.4.17-amzn-7 | 為 HBase 提供 RESTful HTTP 端點的服務。 |
hbase-thrift-server | 2.4.17-amzn-7 | 提供 Thrift 端點到 HBase 的服務。 |
hbase-operator-tools | 2.4.17-amzn-7 | 適用於 Apache HBase 叢集的修復工具。 |
hcatalog-client | 3.1.3-amzn-12 | 操作 hcatalog-server 的「hcat」命令列用戶端。 |
hcatalog-server | 3.1.3-amzn-12 | 服務為分散式應用程式提供 HCatalog、表格和儲存管理層。 |
hcatalog-webhcat-server | 3.1.3-amzn-12 | HTTP 端點提供了 REST 介面至 HCatalog。 |
hive-client | 3.1.3-amzn-12 | Hive 命令列用戶端。 |
hive-hbase | 3.1.3-amzn-12 | Hive-hbase 用戶端。 |
hive-metastore-server | 3.1.3-amzn-12 | 為 Hadoop 操作的 SQL 提供存取 Hive 中繼儲存、存放中繼資料語意儲存庫的服務。 |
hive-server2 | 3.1.3-amzn-12 | 依 Web 請求接受 Hive 查詢的服務。 |
hudi | 0.15.0-amzn-0 | 增量處理架構,以低延遲和高效率強化資料管道。 |
hudi-presto | 0.15.0-amzn-0 | 用於使用 Hudi 執行 Presto 的套件程式庫。 |
hudi-trino | 0.15.0-amzn-0 | 用於使用 Hudi 執行 Trino 的套件程式庫。 |
hudi-spark | 0.15.0-amzn-0 | 用於使用 Hudi 執行 Spark 的套件程式庫。 |
hue-server | 4.11.0 | 使用 Hadoop 生態系統應用程式分析資料的 Web 應用程式 |
iceberg | 1.5.2-amzn-0 | Apache Iceberg 是一種適用於大型分析資料集的開放式資料表格式 |
jupyterhub | 1.5.0 | 適用於 Jupyter 筆記本的多使用者伺服器 |
livy-server | 0.8.0 培養 | 與 Apache Spark 互動的 REST 介面 |
nginx | 1.12.1 | nginx [engine x] 是 HTTP 和反向代理伺服器 |
mariadb-server | 5.5.68+ | MariaDB 資料庫伺服器。 |
nvidia-cuda | 12.3.0 | Nvidia 驅動程式和 Cuda 工具組 |
oozie-client | 5.2.1 | Oozie 命令列用戶端。 |
oozie-server | 5.2.1 | 接受 Oozie 工作流程要求的服務。 |
opencv | 4.7.0 | 開放原始碼電腦 Vision 程式庫。 |
phoenix-library | 5.1.3 | 適用於伺服器和用戶端的 phoenix 程式庫 |
phoenix-connectors | 6.0.0 | 適用於 Spark-3 的 Apache Phoenix 連接器 |
phoenix-query-server | 6.0.0 | 此為一輕量伺服器,可提供對 Avatica API 的 JDBC 存取以及通訊協定緩衝區和 JSON 格式存取 |
presto-coordinator | 0.285-amzn-1 | 在 presto-workers 之間接受查詢和執行管理查詢的服務。 |
presto-worker | 0.285-amzn-1 | 執行查詢各部分的服務。 |
presto-client | 0.285-amzn-1 | 安裝於 HA 叢集的待命主節點的 Presto 命令列用戶端,該主節點上的 Presto 伺服器未啟動。 |
trino-coordinator | 442-amzn-0 | 在 trino-workers 之間接受查詢和執行管理查詢的服務。 |
trino-worker | 442-amzn-0 | 執行查詢各部分的服務。 |
trino-client | 442-amzn-0 | 安裝於 HA 叢集的待命主節點的 Trino 命令列用戶端,該主節點上的 Trino 伺服器未啟動。 |
pig-client | 0.17.0 | Pig 命令列用戶端。 |
r | 4.3.2 | 統計運算 R 專案 |
ranger-kms-server | 2.0.0 | Apache Ranger Key Management System |
spark-client | 3.5.1-amzn-1 | Spark 命令列用戶端。 |
spark-history-server | 3.5.1-amzn-1 | 用於檢視完整 Spark 應用程式生命週期記錄事件的 Web 使用者介面。 |
spark-on-yarn | 3.5.1-amzn-1 | 適用於 YARN 的記憶體內執行引擎。 |
spark-yarn-slave | 3.5.1-amzn-1 | YARN 從屬所需的 Apache Spark 程式庫。 |
spark-rapids | 24.06.1-amzn-0 | Nvidia Spark RAPIDS 外掛程式使用 GPU 加速 Apache Spark。 |
sqoop-client | 1.4.7 | Apache Sqoop 命令列用戶端。 |
tensorflow | 2.16.1 | 適用於高效能數值運算的 TensorFlow 開放原始碼軟體程式庫。 |
tez-on-yarn | 0.10.2-amzn-10 | tez YARN 應用程式和程式庫。 |
tez-on-worker | 0.10.2-amzn-10 | 適用於工作節點的 tez YARN 應用程式和程式庫。 |
zeppelin-server | 0.11.1 | 能進行互動式資料分析,以 Web 為基礎的筆記型電腦。 |
zookeeper-server | 3.9.1-amzn-1 | 用於維護組態資訊、命名、提供分散式同步,並提供群組服務的集中化服務。 |
zookeeper-client | 3.9.1-amzn-1 | ZooKeeper 命令列用戶端。 |
7.3.0 組態分類
組態分類可讓您自訂應用程式。這些檔案通常對應於應用程式的組態 XML 檔案,例如 hive-site.xml
。如需詳細資訊,請參閱設定應用程式。
當您為執行中叢集的執行個體群組指定組態時,就會發生重新設定動作。Amazon EMR 只會為您修改的分類啟動重新設定動作。如需詳細資訊,請參閱重新設定執行中叢集中的執行個體群組。
分類 | 描述 | 重新設定動作 |
---|---|---|
capacity-scheduler | 變更 Hadoop 中 capacity-scheduler.xml 檔案的值。 | Restarts the ResourceManager service. |
container-executor | 在 Hadoop YARN 的 container-executor.cfg 檔案中變更值。 | Not available. |
container-log4j | 變更 Hadoop YARN 的 container-log4j.properties 檔案中的值。 | Not available. |
core-site | 變更 Hadoop 中 core-site.xml 檔案的值。 | Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Ranger KMS, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer. |
docker-conf | 變更 Docker 相關設定。 | Not available. |
emrfs-site | 變更 EMRFS 設定。 | Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts HBaseRegionserver, HBaseMaster, HBaseThrift, HBaseRest, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer. |
flink-conf | 變更 flink-conf.yaml 設定。 | Restarts Flink history server. |
flink-log4j | 變更 Flink log4j.properties 設定。 | Restarts Flink history server. |
flink-log4j-session | 變更 Kubernetes/Yarn 工作階段的 Flink log4j-session.properties 設定。 | Restarts Flink history server. |
flink-log4j-cli | 變更 Flink log4j-cli.properties 設定。 | Restarts Flink history server. |
hadoop-env | 在 Hadoop 環境中變更所有 Hadoop 元件的值。 | Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts PhoenixQueryserver, HiveServer2, Hive MetaStore, and MapReduce-HistoryServer. |
hadoop-log4j | 變更 Hadoop 中 log4j.properties 檔案的值。 | Restarts the Hadoop HDFS services SecondaryNamenode, Datanode, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Hadoop Httpfs, and MapReduce-HistoryServer. |
hadoop-ssl-server | 變更 hadoop ssl 伺服器組態 | Not available. |
hadoop-ssl-client | 變更 hadoop ssl 用戶端組態 | Not available. |
hbase | Apache HBase 的 Amazon EMR 彙整設定。 | Custom EMR specific property. Sets emrfs-site and hbase-site configs. See those for their associated restarts. |
hbase-env | 變更 HBase 環境中的值。 | Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer. |
hbase-log4j | 變更 HBase 的 hbase-log4j.properties 檔案中的值。 | Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer. |
hbase-metrics | 變更 HBase 的 hadoop-metrics2-hbase.properties 檔案中的值。 | Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer. |
hbase-policy | 變更 HBase 的 hbase-policy.xml 檔案中的值。 | Not available. |
hbase-site | 變更 HBase 的 hbase-site.xml 檔案中的值。 | Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer. Additionally restarts Phoenix QueryServer. |
hdfs-encryption-zones | 設定 HDFS 加密區域。 | This classification should not be reconfigured. |
hdfs-env | 變更 HDFS 環境中的值。 | Restarts Hadoop HDFS services Namenode, Datanode, and ZKFC. |
hdfs-site | 變更 HDFS 的 hdfs-site.xml 中的值。 | Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Additionally restarts Hadoop Httpfs. |
hcatalog-env | 變更 HCatalog 環境中的值。 | Restarts Hive HCatalog Server. |
hcatalog-server-jndi | 變更 HCatalog 的 jndi.properties 中的值。 | Restarts Hive HCatalog Server. |
hcatalog-server-proto-hive-site | 變更 HCatalog 的 proto-hive-site.xml 中的值。 | Restarts Hive HCatalog Server. |
hcatalog-webhcat-env | 變更 HCatalog WebHCat 環境中的值。 | Restarts Hive WebHCat server. |
hcatalog-webhcat-log4j2 | 變更 HCatalog WebHCat 的 log4j2.properties 中的值。 | Restarts Hive WebHCat server. |
hcatalog-webhcat-site | 變更 HCatalog WebHCat 的 webhcat-site.xml 檔案中的值。 | Restarts Hive WebHCat server. |
hive | Apache Hive 的 Amazon EMR 彙整設定。 | Sets configurations to launch Hive LLAP service. |
hive-beeline-log4j2 | 變更 Hive 的 beeline-log4j2.properties 檔案中的值。 | Not available. |
hive-parquet-logging | 變更 Hive 的 parquet-logging.properties 檔案中的值。 | Not available. |
hive-env | 變更 Hive 環境中的值。 | Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore. |
hive-exec-log4j2 | 變更 Hive 的 hive-exec-log4j2.properties 檔案中的值。 | Not available. |
hive-llap-daemon-log4j2 | 變更 Hive 的 llap-daemon-log4j2.properties 檔案中的值。 | Not available. |
hive-log4j2 | 變更 Hive 的 hive-log4j2.properties 檔案中的值。 | Not available. |
hive-site | 變更 Hive 的 hive-site.xml 檔案中的值 | Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore. Also restarts Oozie and Zeppelin. |
hiveserver2-site | 變更 Hive Server2 的 hiveserver2-site.xml 檔案中的值 | Not available. |
hue-ini | 變更 Hue 的 ini 檔案中的值 | Restarts Hue. Also activates Hue config override CLI commands to pick up new configurations. |
httpfs-env | 變更 HTTPFS 環境中的值。 | Restarts Hadoop Httpfs service. |
httpfs-site | 變更 Hadoop 中 httpfs-site.xml 檔案的值。 | Restarts Hadoop Httpfs service. |
hadoop-kms-acls | 變更 Hadoop 中 kms-acls.xml 檔案的值。 | Not available. |
hadoop-kms-env | 變更 Hadoop KMS 環境中的值。 | Restarts Hadoop-KMS service. |
hadoop-kms-java-home | 變更 Hadoop 的 KMS Java Home | Not available. |
hadoop-kms-log4j | 變更 Hadoop 的 kms-log4j.properties 檔案中的值。 | Not available. |
hadoop-kms-site | 變更 Hadoop 中 kms-site.xml 檔案的值。 | Restarts Hadoop-KMS and Ranger-KMS service. |
hudi-env | 變更 Hudi 環境中的值。 | Not available. |
hudi-defaults | 變更 Hudi 的 hudi-defaults.conf 檔案中的值。 | Not available. |
iceberg-defaults | 變更 Iceberg 的 iceberg-defaults.conf 檔案中的值。 | Not available. |
delta-defaults | 變更 Delta 的 delta-defaults.conf 檔案中的值。 | Not available. |
jupyter-notebook-conf | 變更 Jupyter 筆記本中 jupyter_notebook_config.py 檔案的值。 | Not available. |
jupyter-hub-conf | 變更 JupyterHubs 中 jupyterhub_config.py 檔案的值。 | Not available. |
jupyter-s3-conf | 設定 Jupyter 筆記本 S3 持久性。 | Not available. |
jupyter-sparkmagic-conf | 變更 Sparkmagic 中 config.json 檔案的值。 | Not available. |
livy-conf | 變更 Livy 的 livy.conf 檔案中的值。 | Restarts Livy Server. |
livy-env | 變更 Livy 環境中的值。 | Restarts Livy Server. |
livy-log4j2 | 變更 Livy log4j2.properties 設定。 | Restarts Livy Server. |
mapred-env | 變更 MapReduce 應用程式環境中的值。 | Restarts Hadoop MapReduce-HistoryServer. |
mapred-site | 變更 MapReduce 應用程式 mapred-site.xml 檔案中的值。 | Restarts Hadoop MapReduce-HistoryServer. |
oozie-env | 變更 Oozie 環境中的值。 | Restarts Oozie. |
oozie-log4j | 變更 Oozie 的 oozie-log4j.properties 檔案中的值。 | Restarts Oozie. |
oozie-site | 變更 Oozie 的 oozie-site.xml 檔案中的值。 | Restarts Oozie. |
phoenix-hbase-metrics | 變更 Phoenix 的 hadoop-metrics2-hbase.properties 檔案中的值。 | Not available. |
phoenix-hbase-site | 變更 Phoenix 的 hbase-site.xml 檔案中的值。 | Not available. |
phoenix-log4j | 變更 Phoenix 中 log4j.properties 檔案的值。 | Restarts Phoenix-QueryServer. |
phoenix-metrics | 變更 Phoenix 的 hadoop-metrics2-phoenix.properties 檔案中的值。 | Not available. |
pig-env | 在 Pig 環境中變更值。 | Not available. |
pig-properties | 變更 Pig 的 pig.properties 檔案中的值。 | Restarts Oozie. |
pig-log4j | 變更 Pig 的 log4j.properties 檔案中的值。 | Not available. |
presto-log | 變更 Presto 的 log.properties 檔案中的值。 | Restarts Presto-Server (for PrestoDB) |
presto-config | 變更 Presto 的 config.properties 檔案中的值。 | Restarts Presto-Server (for PrestoDB) |
presto-password-authenticator | 變更 Presto 的 password-authenticator.properties 檔案中的值。 | Not available. |
presto-env | 變更 Presto 的 presto-env.sh 檔案中的值。 | Restarts Presto-Server (for PrestoDB) |
presto-node | 變更 Presto 的 node.properties 檔案中的值。 | Not available. |
presto-connector-blackhole | 變更 Presto 的 blackhole.properties 檔案中的值。 | Not available. |
presto-connector-cassandra | 變更 Presto 的 cassandra.properties 檔案中的值。 | Not available. |
presto-connector-hive | 變更 Presto 的 hive.properties 檔案中的值。 | Restarts Presto-Server (for PrestoDB) |
presto-connector-jmx | 變更 Presto 的 jmx.properties 檔案中的值。 | Not available. |
presto-connector-kafka | 變更 Presto 的 kafka.properties 檔案中的值。 | Not available. |
presto-connector-lakeformation | 變更 Presto 的 lakeformation.properties 檔案中的值。 | Restarts Presto-Server (for PrestoDB) |
presto-connector-localfile | 變更 Presto 的 localfile.properties 檔案中的值。 | Not available. |
presto-connector-memory | 變更 Presto 的 memory.properties 檔案中的值。 | Not available. |
presto-connector-mongodb | 變更 Presto 的 mongodb.properties 檔案中的值。 | Not available. |
presto-connector-mysql | 變更 Presto 的 mysql.properties 檔案中的值。 | Not available. |
presto-connector-postgresql | 變更 Presto 的 postgresql.properties 檔案中的值。 | Not available. |
presto-connector-raptor | 變更 Presto 的 raptor.properties 檔案中的值。 | Not available. |
presto-connector-redis | 變更 Presto 的 redis.properties 檔案中的值。 | Not available. |
presto-connector-redshift | 變更 Presto 的 redshift.properties 檔案中的值。 | Not available. |
presto-connector-tpch | 變更 Presto 的 tpch.properties 檔案中的值。 | Not available. |
presto-connector-tpcds | 變更 Presto 的 tpcds.properties 檔案中的值。 | Not available. |
trino-log | 變更 Trino 的 log.properties 檔案中的值。 | Restarts Trino-Server (for Trino) |
trino-config | 變更 Trino 的 config.properties 檔案中的值。 | Restarts Trino-Server (for Trino) |
trino-password-authenticator | 變更 Trino 的 password-authenticator.properties 檔案中的值。 | Restarts Trino-Server (for Trino) |
trino-env | 變更 Trino 的 trino-env.sh 檔案中的值。 | Restarts Trino-Server (for Trino) |
trino-node | 變更 Trino 的 node.properties 檔案中的值。 | Not available. |
trino-connector-blackhole | 變更 Trino 的 blackhole.properties 檔案中的值。 | Not available. |
trino-connector-cassandra | 變更 Trino 的 cassandra.properties 檔案中的值。 | Not available. |
trino-connector-delta | 變更 Trino 的 delta.properties 檔案中的值。 | Restarts Trino-Server (for Trino) |
trino-connector-hive | 變更 Trino 的 hive.properties 檔案中的值。 | Restarts Trino-Server (for Trino) |
trino-exchange-manager | 變更 Trino 的 exchange-manager.properties 檔案中的值。 | Restarts Trino-Server (for Trino) |
trino-connector-iceberg | 變更 Trino 的 iceberg.properties 檔案中的值。 | Restarts Trino-Server (for Trino) |
trino-connector-hudi | 變更 Trino 的 hudi.properties 檔案中的值。 | Restarts Trino-Server (for Trino) |
trino-connector-jmx | 變更 Trino 的 jmx.properties 檔案中的值。 | Not available. |
trino-connector-kafka | 變更 Trino 的 kafka.properties 檔案中的值。 | Not available. |
trino-connector-localfile | 變更 Trino 的 localfile.properties 檔案中的值。 | Not available. |
trino-connector-memory | 變更 Trino 的 memory.properties 檔案中的值。 | Not available. |
trino-connector-mongodb | 變更 Trino 的 mongodb.properties 檔案中的值。 | Not available. |
trino-connector-mysql | 變更 Trino 的 mysql.properties 檔案中的值。 | Not available. |
trino-connector-postgresql | 變更 Trino 的 postgresql.properties 檔案中的值。 | Not available. |
trino-connector-raptor | 變更 Trino 的 raptor.properties 檔案中的值。 | Not available. |
trino-connector-redis | 變更 Trino 的 redis.properties 檔案中的值。 | Not available. |
trino-connector-redshift | 變更 Trino 的 redshift.properties 檔案中的值。 | Not available. |
trino-connector-tpch | 變更 Trino 的 tpch.properties 檔案中的值。 | Not available. |
trino-connector-tpcds | 變更 Trino 的 tpcds.properties 檔案中的值。 | Not available. |
ranger-kms-dbks-site | 變更 Ranger KMS 之 dbks-site.xml 檔案中的值。 | Restarts Ranger KMS Server. |
ranger-kms-site | 變更 Ranger KMS 之 ranger-kms-site.xml 檔案中的值。 | Restarts Ranger KMS Server. |
ranger-kms-env | 變更 Ranger KMS 環境中的值。 | Restarts Ranger KMS Server. |
ranger-kms-logback | 變更 Ranger KMS 的 kms-logback.xml 檔案中的值。 | Not available. |
ranger-kms-db-ca | 變更 S3 上 CA 檔案的值,以使用 Ranger KMS 進行 MySQL SSL 連線。 | Not available. |
spark | Apache Spark 的 Amazon EMR 彙整設定。 | This property modifies spark-defaults. See actions there. |
spark-defaults | 變更 Spark 的 spark-defaults.conf 檔案中的值。 | Restarts Spark history server and Spark thrift server. |
spark-env | 變更 Spark 環境中的值。 | Restarts Spark history server and Spark thrift server. |
spark-hive-site | 變更 Spark 的 hive-site.xml 檔案中的值 | Not available. |
spark-log4j2 | 變更 Spark 中 log4j2.properties 檔案中的值。 | Restarts Spark history server and Spark thrift server. |
spark-metrics | 變更 Spark 中 metrics.properties 檔案的值。 | Restarts Spark history server and Spark thrift server. |
sqoop-env | 變更 Sqoop 環境中的值。 | Not available. |
sqoop-oraoop-site | 變更 Sqoop OraOop 的 oraoop-site.xml 檔案中的值。 | Not available. |
sqoop-site | 變更 Sqoop 的 sqoop-site.xml 檔案中的值。 | Not available. |
tez-site | 變更 Tez 的 tez-site.xml 檔案中的值。 | Restart Oozie and HiveServer2. |
yarn-env | 變更 YARN 環境中的值。 | Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts MapReduce-HistoryServer. |
yarn-site | 變更 YARN 的 yarn-site.xml 檔案中的值。 | Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Livy Server and MapReduce-HistoryServer. |
zeppelin-env | 變更 Zeppelin 環境中的值。 | Restarts Zeppelin. |
zeppelin-site | 變更 zeppelin-site.xml 中的組態設定。 | Restarts Zeppelin. |
zookeeper-config | 變更 ZooKeeper 的 zoo.cfg 檔案中的值。 | Restarts Zookeeper server. |
zookeeper-logback | 在 ZooKeeper 的 logback.xml 檔案中變更值。 | Restarts Zookeeper server. |
emr-metrics | 變更此節點的 emr 指標設定。 | Restarts the CloudWatchAgent service. |
7.3.0 變更日誌
日期 | 事件 | 描述 |
---|---|---|
2024-10-17 | 文件出版 | Amazon EMR 7.3.0 版本備註首次發佈 |
2024-10-16 |
部署完成 | Amazon EMR 7.3.0 完全部署到所有支援的區域 |
2024-10-14 | 初始版本 | Amazon EMR 7.3.0 首次部署到初始商業區域 |