Apache HBase - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Apache HBase

HBase adalah database terdistribusi sumber terbuka dan non-relasional yang dikembangkan sebagai bagian dari proyek Hadoop Apache Software Foundation. HBase berjalan di atas Sistem File Terdistribusi Hadoop (HDFS) untuk menyediakan kemampuan database non-relasional untuk ekosistem Hadoop. HBase termasuk dalam rilis Amazon EMR versi 4.6.0 dan versi yang lebih tinggi.

HBase bekerja secara mulus dengan Hadoop, berbagi sistem file dan berfungsi sebagai input dan output langsung ke MapReduce kerangka kerja dan mesin eksekusi. HBase juga terintegrasi dengan Apache Hive, yang mengaktifkan kueri seperti SQL melalui tabel HBase, bergabung dengan tabel berbasis Hive, dan dukungan untuk Java Database Connectivity (JDBC). Untuk informasi selengkapnya tentang HBase, lihat Apache HBase dan dokumentasi HBase di situs web Apache. Untuk contoh bagaimana menggunakan HBase dengan Hive, lihat AWS Posting Blog Big Data Gabungkan NoSQL dan analisis paralel besar-besaran menggunakan Apache HBase dan Apache Hive di Amazon EMR.

Dengan HBase di Amazon EMR, Anda juga dapat mencadangkan data HBase Anda langsung ke Amazon Simple Storage Service (Amazon S3), dan mengembalikan dari cadangan sebelumnya yang dibuat ketika meluncurkan klaster HBase. Amazon EMR menawarkan opsi tambahan untuk mengintegrasikan dengan Amazon S3 untuk ketekunan data dan pemulihan bencana.

  • HBase Amazon S3 - Dengan Amazon EMR versi 5.2.0 dan yang lebih baru, Anda dapat menggunakan HBase di Amazon S3 untuk menyimpan direktori root HBase klaster dan metadata langsung ke Amazon S3. Anda kemudian dapat memulai sebuah klaster baru, menunjuk ke lokasi direktori root di Amazon S3. Hanya satu klaster pada suatu waktu yang dapat menggunakan lokasi HBase di Amazon S3, dengan pengecualian dari klaster replika baca. Untuk informasi selengkapnya, lihat HBase pada Amazon S3 (mode penyimpanan Amazon S3).

  • Replika baca HBase - Amazon EMR versi 5.7.0 dan yang lebih baru dengan HBase di Amazon S3 mendukung klaster baca replika. Klaster replika baca menyediakan akses baca-saja ke file penyimpanan dan metadata klaster utama untuk operasi baca-saja. Untuk informasi selengkapnya, lihat Menggunakan klaster replika baca..

  • HBase snapshot - Sebagai alternatif untuk HBase di Amazon S3, dengan EMR versi 4.0 dan yang lebih baru Anda dapat membuat snapshot dari data HBase secara langsung ke Amazon S3 dan kemudian memulihkan data menggunakan snapshot. Untuk informasi selengkapnya, lihat Menggunakan snapshot HBase.

Tabel berikut mencantumkan versi HBase yang tercakup dalam rilis Amazon EMR seri 6.x terbaru, bersama dengan komponen yang diinstal Amazon EMR dengan HBase.

Untuk versi komponen yang diinstal dengan HBase dalam rilis ini, lihat Rilis 6.8.0 Versi Komponen.

Informasi versi HBase untuk emr-6.8.0
Amazon EMR Label Rilis HBase Versi Komponen terinstal Dengan HBase

emr-6.8.0

HBase 2.4.12

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

catatan

Apache HBase HBCK2 adalah alat operasi terpisah untuk memperbaiki wilayah HBase dan tabel sistem. Di Amazon EMR versi 6.1.0 dan yang lebih baru, hbase-hbck2.jar disediakan/usr/lib/hbase-operator-tools/ di simpul utama. Untuk informasi selengkapnya tentang cara membangun dan menggunakan ini, lihat HBase HBCK2.

Tabel berikut mencantumkan versi HBase yang tercakup dalam rilis Amazon EMR seri 5.x terbaru, bersama dengan komponen yang diinstal Amazon EMR dengan HBase.

Untuk versi komponen yang diinstal dengan HBase dalam rilis ini, lihat Rilis 5.36.0 Versi Komponen.

Informasi versi HBase untuk emr-5.36.0
Amazon EMR Label Rilis HBase Versi Komponen terinstal Dengan HBase

emr-5.36.0

HBase 1.4.13

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server