Uso del controlador JDBC de Hive

Puede usar herramientas de inteligencia empresarial populares MicroStrategy, como Microsoft Excel y Tableau con Amazon EMRQlikView, para explorar y visualizar sus datos. Muchas de estas herramientas requieren un controlador de conectividad de bases de datos Java (JDBC) o un controlador de conectividad de bases de datos abiertas (ODBC). Amazon EMR admite tanto la conectividad JDBC como ODBC.

El siguiente ejemplo demuestra el uso de SQL Workbench/J como cliente de SQL para conectarse a un clúster de Hive en Amazon EMR. Para ver otros controladores, consulte Utilizar herramientas de inteligencia empresarial con Amazon EMR.

Antes de instalar y trabajar con SQL Workbench/J, descargue el paquete del controlador e instale el controlador. Los controladores que se incluyen en el paquete admiten las versiones de Hive disponibles en la versión 4.0 y posteriores de Amazon EMR. Para ver las notas de la versión y documentación detallada, consulte la documentación de PDF incluida en el paquete.

Descarga del paquete de controladores JDBC de Hive más reciente

http://awssupportdatasvcs.com/bootstrap-actions/Simba/latest/
Versiones anteriores del controlador JDBC de Hive

http://awssupportdatasvcs.com/bootstrap-actions/Simba/

Para instalar y configurar SQL Workbench

Descargue el Workbench/J cliente SQL para su sistema operativo desde. http://www.sql-workbench.net/downloads.html
Instale SQL Workbench/J. Para obtener más información, consulte Instalación e inicio de SQL Workbench/J en el manual del usuario del manual de SQL. Workbench/J
Usuarios de Linux, Unix, Mac OS X: en una sesión de terminal, cree un túnel de SSH al nodo principal del clúster utilizando el siguiente comando. master-public-dns-nameSustitúyalo por el nombre DNS público del nodo maestro y path-to-key-file por la ubicación y el nombre de archivo de tu archivo de clave EC2 privada de Amazon (.pem).
```
ssh -o ServerAliveInterval=10 -i path-to-key-file -N -L 10000:localhost:10000 hadoop@master-public-dns-name
```
Usuarios de Windows: en una sesión de PuTTY, cree un túnel SSH al nodo maestro de su clúster (mediante el reenvío de puertos locales) con 10000 para Puerto de origen y master-public-dns-name:10000 para Destino. Sustituya master-public-dns-name por el nombre DNS público del nodo principal.
Añadir el controlador JDBC a SQL Workbench.
1. En el cuadro de diálogo Select Connection Profile (Seleccionar perfil de conexión), haga clic en Manage Drivers (Administrar controladores).
2. Haga clic en el icono Create a new entry (Crear una entrada nueva) (página en blanco).
3. En el campo Name (Nombre), escriba Hive JDBC.
4. En Library (Biblioteca), haga clic en el icono Select the JAR file(s) (Seleccionar los archivos JAR).
5. Navegue hasta la ubicación que contiene los controladores extraídos. Seleccione los controladores que se incluyen en la versión del paquete de controladores JDBC que ha descargado y haga clic en Abrir.
  
  Por ejemplo, su paquete de controladores JDBC puede incluir lo siguiente. JARs
```
hive_metastore.jar
hive_service.jar
HiveJDBC41.jar
libfb303-0.9.0.jar
libthrift-0.9.0.jar
log4j-1.2.14.jar
ql.jar
slf4j-api-1.5.11.jar
slf4j-log4j12-1.5.11.jar
TCLIServiceClient.jar
zookeeper-3.4.6.jar
```
6. En el cuadro de diálogo Please select one driver (Seleccione un controlador), seleccione com.amazon.hive.jdbc41.HS2Driver, seguido de OK (Aceptar).
Cuando vuelva al cuadro de diálogo Manage Drivers (Administrar controladores), compruebe que el campo Classname (Nombre de clase) esté relleno y seleccione OK (Aceptar).
Cuando vuelva al cuadro de diálogo Select Connection Profile (Seleccionar perfil de conexión), compruebe que el campo Driver (Controlador) esté definido en Hive JDBC (JDBC de Hive) y proporcione la siguiente cadena de conexión de JDBC en el campo URL: jdbc:hive2://localhost:10000/default.
Seleccione OK (Aceptar) para conectarse. Una vez completada la conexión, los detalles de la conexión aparecen en la parte superior de la ventana SQL Workbench/J .

Para obtener más información sobre el uso de Hive y la interfaz JDBC, consulte HiveClientla documentación de Hive JDBCInterface in Apache Hive.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Uso de una base de datos MySQL externa o Amazon Aurora

Mejora del rendimiento de Hive