Gunakan driver Hive JDBC - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Gunakan driver Hive JDBC

Anda dapat menggunakan alat bantu kecerdasan bisnis populer seperti Microsoft Excel, MicroStrategy, QlikView, dan Tableau dengan Amazon EMR untuk menjelajahi dan memvisualisasikan data Anda. Banyak alat bantu ini yang memerlukan driver Java Database Connectivity (JDBC) atau Open Database Connectivity (ODBC). Amazon EMR mendukung konektivitas JDBC dan ODBC.

Contoh di bawah ini menunjukkan penggunaan SQL Workbench/J sebagai klien SQL untuk menghubungkan kluster Hive di Amazon EMR. Untuk driver tambahan, lihat Gunakan alat bantu kecerdasan bisnis dengan Amazon EMR.

Sebelum Anda menginstal dan bekerja dengan SQL Workbench/J, unduh paket driver dan instal driver terkait. Driver yang tercakup dalam paket yang mendukung versi Hive tersedia di rilis Amazon EMR versi 4.0 dan versi yang lebih tinggi. Untuk catatan rilis dan dokumentasi terperinci, lihat dokumentasi PDF yang disertakan dalam paket.

Untuk menginstal dan mengonfigurasi SQL Workbench
  1. Unduh klien SQL Workbench/J untuk sistem operasi Anda dari http://www.sql-workbench.net/downloads.html.

  2. Instal SQL Workbench/J. Untuk informasi selengkapnya, lihat Menginstal dan memulai SQL Workbench/J dalam Panduan Pengguna SQL Workbench/J.

  3. Pengguna Linux, Unix, Mac OS X: Dalam sesi terminal, buat terowongan SSH ke simpul utama kluster Anda menggunakan perintah berikut ini. Ganti master-public-dns-name dengan nama DNS publik dari simpul utama dan path-to-key-file dengan lokasi dan nama berkas dari berkas kunci privat Amazon EC2 (.pem).

    ssh -o ServerAliveInterval=10 -i path-to-key-file -N -L 10000:localhost:10000 hadoop@master-public-dns-name

    Pengguna Windows: Dalam sesi PuTTY, buat terowongan SSH ke simpul utama kluster Anda (menggunakan penerusan port lokal) dengan10000untukPort sumberdanmaster-public-dns-name:10000untukTujuan. Ganti master-public-dns-name dengan nama DNS publik dari simpul utama.

  4. Tambahkan driver JDBC ke SQL Workbench.

    1. Di kotak dialog Pilih Profil Koneksi, klik Kelola Driver.

    2. Klik ikon Buat entri baru (halaman kosong).

    3. Pada kolom Nama, ketikkan Hive JDBC.

    4. Untuk Pustaka, klik ikon Pilih file JAR.

    5. Arahkan ke lokasi yang berisi driver yang diekstraksi. Pilih driver yang disertakan dalam versi paket driver JDBC yang Anda download, dan klikBuka.

      Misalnya, paket driver JDBC Anda mungkin termasuk guci berikut.

      hive_metastore.jar hive_service.jar HiveJDBC41.jar libfb303-0.9.0.jar libthrift-0.9.0.jar log4j-1.2.14.jar ql.jar slf4j-api-1.5.11.jar slf4j-log4j12-1.5.11.jar TCLIServiceClient.jar zookeeper-3.4.6.jar
    6. Pada kotak dialog Pilih satu driver, pilih com.amazon.hive.jdbc41.HS2Driver, OKE.

  5. Ketika Anda kembali ke kotak dialog Kelola Driver, pastikan bahwa kolom Classname telah diisi dan pilih OKE.

  6. Ketika Anda kembali ke kotak dialog Pilih Profil Koneksi, pastikan bahwa kolom Driver telah ditetapkan ke JDBC Hive dan ketikkan string koneksi JDBC berikut ini pada kolom URL:jdbc:hive2://localhost:10000/default.

  7. Pilih OKE untuk menghubungkan. Setelah koneksi selesai, rincian koneksi ditampilkan di bagian atas jendela SQL Workbench/J.

Untuk informasi lebih lanjut tentang penggunaan Hive dan antarmuka JDBC, lihat HiveClient dan HiveJDBCInterface dalam dokumentasi Apache Hive.