Apache Hive - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Apache Hive

Hive 是一款在 Hadoop 叢集上執行的開源資料倉儲暨分析套件。Hive 腳本使用SQL類似的語言,稱為 Hive QL(查詢語言),該語言將編程模型抽象化並支持典型的數據倉庫交互。Hive 可讓您避免撰寫 Tez 工作的複雜性,根據有向無環圖 (DAGs) 或較低層級的電腦語言 (例如 Java) 的 MapReduce 程式。

蜂巢通過包括序列SQL化格式擴展範例。也可以建立與您的資料相符的表格結構描述,以自訂查詢處理作業,而無需接觸資料本身。雖然SQL僅支持原始值類型,例如日期,數字和字符串),但 Hive 表值是結構化元素,例如JSON對象,任何用戶定義的數據類型或用 Java 編寫的任何函數。

如需關於 Hive 的詳細資訊,請參閱 http://hive.apache.org/

下表列出了 Amazon EMR 7.x 系列最新版本中包含的 Hive 版本,以及 Amazon 與 Hive 一起EMR安裝的組件。

如需此發行版本中隨 Hive 一起安裝的元件版本,請參閱 7.2.0 版元件版本

適用於 EMR-7.2.0 的蜂巢版本資訊
Amazon EMR 發布標籤 Hive 版本 與 Hive 一起搭配安裝的元件

埃姆尔 -7.2.0

Hive 3.1.3

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server

下表列出了 Amazon EMR 6.x 系列最新版本中包含的 Hive 版本,以及 Amazon 與 Hive 一起EMR安裝的組件。

如需此版本中與 Hive 一起搭配安裝的元件版本,請參閱發行版本 6.15.0 元件版本

emr-6.15.0 的 Hive 版本資訊
Amazon EMR 發布標籤 Hive 版本 與 Hive 一起搭配安裝的元件

emr-6.15.0

Hive 3.1.3

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server

下表列出了 Amazon EMR 5.x 系列最新版本中包含的 Hive 版本,以及 Amazon 與 Hive 一起EMR安裝的組件。

如需此發行版本中隨 Hive 一起安裝的元件版本,請參閱版本 5.36.2 元件版本。

適用於 EMR -5.36.2 的配置單元版本信息
Amazon EMR 發布標籤 Hive 版本 與 Hive 一起搭配安裝的元件

埃姆尔 -5.36.2

Hive 2.3.9

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn

從 Amazon EMR 5.18.0 開始,您可以使用 Amazon EMR 成品儲存庫,根據特定 Amazon EMR 版本提供的確切程式庫版本和相依性來建立任務程式碼。如需詳細資訊,請參閱 使用 Amazon EMR 成品儲存庫檢查相依性