Apache Hive - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Apache Hive

Hive adalah gudang data dan paket analitik sumber terbuka yang berjalan di atas Hadoop. Skrip Hive menggunakan bahasa SQL seperti yang disebut Hive QL (bahasa kueri) yang mengabstraksi model pemrograman dan mendukung interaksi data gudang data yang khas. Hive mengizinkan Anda untuk menghindari kompleksitas menulis tugas Tez berdasarkan grafik asiklik terarah (DAG) atau MapReduce program dalam bahasa komputer tingkat yang lebih rendah, seperti Java.

Hive memperluas paradigma SQL dengan memasukkan format serialisasi. Anda juga dapat menyesuaikan pemrosesan kueri dengan membuat skema tabel yang sesuai dengan data Anda tanpa menyentuh data itu sendiri. Ketika SQL hanya mendukung jenis nilai primitif, seperti tanggal, angka, dan string), nilai-nilai tabel Hive adalah elemen terstruktur, seperti objek JSON, tipe data apa pun yang ditetapkan pengguna, atau fungsi yang ditulis di Java.

Untuk informasi selengkapnya tentang Hive, lihat http://hive.apache.org/.

Tabel berikut mencantumkan versi Hive yang tercakup dalam rilis terbaru Amazon EMR seri 6.x, bersama dengan komponen yang diinstal Amazon EMR menginstal EMR dengan Hive.

Untuk versi komponen yang diinstal dengan Hive dalam rilis ini, lihat Rilis Versi Komponen 6.9.0.

Informasi versi Hive untuk emr-6.9.0
Amazon EMR Label Rilis Amazon EMR Hive Versi Hive Komponen Dipasang Dengan Hive

emr-6.9.0

Hive 3.1.3

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, zookeeper-client, zookeeper-server

Tabel berikut mencantumkan versi Hive yang tercakup dalam rilis terbaru Amazon EMR 5.x series, bersama dengan komponen yang diinstal Amazon EMR menginstal EMR dengan Hive.

Untuk versi komponen yang diinstal dengan Hive dalam rilis ini, lihat Rilis 5.36.0 Versi Komponen.

Informasi versi Hive untuk emr-5.36.0
Amazon EMR Label Rilis Amazon EMR Hive Versi Hive Komponen Dipasang Dengan Hive

emr-5.36.0

Hive 2.3.9

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn

Dimulai dengan Amazon EMR 5.18.0, Anda dapat menggunakan repositori artefak Amazon EMR untuk membangun kode tugas Anda terhadap versi perpustakaan dan dependensi yang tepat yang tersedia dengan rilis Amazon EMR tertentu. Untuk informasi selengkapnya, lihat Memeriksa dependensi menggunakan repositori artefak Amazon EMR.