Hive JDBC 드라이버 사용 - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Hive JDBC 드라이버 사용

Microsoft Excel, MicroStrategy, QlikView, Tableau 등과 같은 인기 있는 비즈니스 인텔리전스 도구를 Amazon EMR과 함께 사용하여 데이터를 탐색하고 시각화할 수 있습니다. 이러한 도구에는 대부분 ODBC(Open Database Connectivity) 또는 JDBC(Java Database Connectivity) 드라이버가 필요합니다. Amazon EMR은 JDBC 및 ODBC 연결을 모두 지원합니다.

아래 예제는 SQL Workbench/J를 SQL 클라이언트로 사용하여 Amazon EMR의 Hive 클러스터에 연결하는 방법을 보여줍니다. 기타 드라이버의 경우 Amazon EMR에서 비즈니스 인텔리전스 도구 사용을 참조하세요.

SQL Workbench/J를 설치하여 사용하기 전에 드라이버 패키지를 다운로드하여 드라이버를 설치하십시오. 패키지에 포함된 드라이버는 Amazon EMR 릴리스 버전 4.0 이상에서 사용 가능한 Hive 버전을 지원합니다. 자세한 출시 정보 및 설명서를 보려면 패키지에 포함된 PDF 설명서를 참조하십시오.

SQL Workbench를 설치하고 구성하려면
  1. http://www.sql-workbench.net/downloads.html에서 운영 체제에 맞는 SQL Workbench/J 클라이언트를 다운로드합니다.

  2. 자세한 내용은 SQL Workbench/J 사용 설명서에서 Installing and starting SQL Workbench/J를 참조하십시오.

  3. Linux, Unix, Mac OS X 사용자: 터미널 세션에서 다음 명령을 사용하여 클러스터의 마스터 노드에 대한 SSH 터널을 생성합니다. master-public-dns-name을 프라이머리 노드의 퍼블릭 DNS 이름으로 바꾸고 path-to-key-file을 Amazon EC2 프라이빗 키(.pem) 파일의 위치 및 파일 이름으로 바꿉니다.

    ssh -o ServerAliveInterval=10 -i path-to-key-file -N -L 10000:localhost:10000 hadoop@master-public-dns-name

    Windows 사용자: PuTTY 세션에서 소스 포트10000, 대상master-public-dns-name:10000을 사용하여 클러스터의 프라이머리 노드에 대한 SSH 터널을 생성합니다(로컬 포트 전달 사용). master-public-dns-name을 마스터 노드의 퍼블릭 DNS 이름으로 바꿉니다.

  4. JDBC 드라이버를 SQL Workbench에 추가합니다.

    1. Select Connection Profile(연결 프로파일 선택) 대화 상자에서 Manage Drivers(드라이버 관리)를 클릭합니다.

    2. Create a new entry(새 항목 생성)(빈 페이지) 아이콘을 클릭합니다.

    3. Name(이름) 필드에 Hive JDBC을(를) 입력합니다.

    4. 라이브러리에서 Select the JAR file(s)(JAR 파일 선택) 아이콘을 클릭합니다.

    5. 추출된 드라이버를 포함하는 위치로 이동합니다. 다운로드한 JDBC 드라이버 패키지 버전에 포함된 드라이버를 선택하고 열기를 클릭합니다.

      예를 들어 JDBC 드라이버 패키지에는 다음 JAR이 포함될 수 있습니다.

      hive_metastore.jar hive_service.jar HiveJDBC41.jar libfb303-0.9.0.jar libthrift-0.9.0.jar log4j-1.2.14.jar ql.jar slf4j-api-1.5.11.jar slf4j-log4j12-1.5.11.jar TCLIServiceClient.jar zookeeper-3.4.6.jar
    6. Please select one driver(드라이버 하나를 선택하십시오) 대화 상자에서 com.amazon.hive.jdbc41.HS2DriverOK(확인)를 선택합니다.

  5. Manage Drivers(드라이버 관리) 대화 상자로 돌아가면 Classname 필드가 채워져 있는지 확인하고 OK(확인)를 선택합니다.

  6. Select Connection Profile(연결 프로파일 선택) 대화 상자로 돌아가면 Driver(드라이버) 필드가 Hive JDBC로 설정되어 있는지 확인하고 URL 필드에 jdbc:hive2://localhost:10000/default JDBC 연결 문자열을 제공합니다.

  7. OK(확인)를 선택하여 연결합니다. 연결이 완료된 후 SQL Workbench/J 창 상단에 연결 세부 정보가 나타납니다.

Hive 및 JDBC 인터페이스 사용에 대한 자세한 내용은 Apache Hive 설명서의 HiveClientHiveJDBCInterface를 참조하십시오.