Apache Hive - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Apache Hive

Hive는 하둡 클러스터를 기반으로 실행되는 오픈 소스 데이터 웨어하우스 및 분석 패키지입니다. Hive 스크립트는 프로그래밍 모델을 추상화하고 일반적인 데이터 웨어하우스 상호 작용을 지원하는 Hive QL(쿼리 언어)이라는 SQL유사 언어를 사용합니다. Hive를 사용하면 지시된 비순환 그래프(DAGs) 또는 Java와 같은 하위 수준의 컴퓨터 언어로 된 MapReduce 프로그램을 기반으로 Tez 작업을 작성하는 복잡성을 방지할 수 있습니다.

Hive는 직렬화 형식을 포함하여 SQL 패러다임을 확장합니다. 데이터 자체를 건드리지 않고 데이터와 일치하는 테이블 스키마를 생성하여 쿼리 처리를 사용자 지정할 수도 있습니다. 는 날짜, 숫자 및 문자열과 같은 기본 값 유형SQL만 지원하지만 Hive 테이블 값은 JSON 객체, 사용자 정의 데이터 유형 또는 Java로 작성된 함수와 같은 구조화된 요소입니다.

Hive에 대한 자세한 내용은 http://hive.apache.org/를 참조하십시오.

다음 표에는 Amazon EMR7.x 시리즈의 최신 릴리스에 포함된 Hive 버전과 Amazon이 Hive와 함께 EMR 설치하는 구성 요소가 나열되어 있습니다.

이 릴리스에서 Hive와 함께 설치된 구성 요소의 버전은 릴리스 7.3.0 구성 요소 버전 을 참조하세요.

emr-7.3.0에 대한 Hive 버전 정보
Amazon EMR 릴리스 레이블 Hive 버전 Hive와 함께 설치된 구성 요소

emr-7.3.0

Hive 3.1.3

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server

다음 표에는 Amazon EMR6.x 시리즈의 최신 릴리스에 포함된 Hive 버전과 Amazon이 Hive와 함께 EMR 설치하는 구성 요소가 나열되어 있습니다.

이 릴리스에서 Hive와 함께 설치된 구성 요소의 버전은 릴리스 6.15.0 구성 요소 버전을 참조하세요.

emr-6.15.0용 Hive 버전 정보
Amazon EMR 릴리스 레이블 Hive 버전 Hive와 함께 설치된 구성 요소

emr-6.15.0

Hive 3.1.3

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server

다음 표에는 Amazon EMR5.x 시리즈의 최신 릴리스에 포함된 Hive 버전과 Amazon이 Hive와 함께 EMR 설치하는 구성 요소가 나열되어 있습니다.

이 릴리스에서 Hive와 함께 설치된 구성 요소의 버전은 릴리스 5.36.2 구성 요소 버전 을 참조하세요.

emr-5.36.2에 대한 Hive 버전 정보
Amazon EMR 릴리스 레이블 Hive 버전 Hive와 함께 설치된 구성 요소

emr-5.36.2

Hive 2.3.9

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn

Amazon EMR 5.18.0부터 Amazon EMR 아티팩트 리포지토리를 사용하여 특정 Amazon EMR 릴리스에서 사용할 수 있는 라이브러리 및 종속성의 정확한 버전에 대해 작업 코드를 빌드할 수 있습니다. 자세한 내용은 Amazon EMR 아티팩트 리포지토리를 사용하여 종속성 확인 단원을 참조하십시오.