HiveQL 문 처리 - Amazon DynamoDB

HiveQL 문 처리

Hive는 MapReduce 작업을 실행하기 위한 일괄 처리 중심 프레임워크인 Hadoop에서 실행되는 애플리케이션입니다. HiveQL 문을 실행하면 Hive가 결과를 즉시 반환할 수 있는지 또는 MapReduce 작업을 제출해야 하는지 판단합니다.

예를 들어 ddb_features 테이블을 고려해 봅니다(자습서: Amazon DynamoDB 및 Apache Hive 작업 참조). 다음 Hive 쿼리는 주 약어와 각 주의 산정 수를 표시합니다.

SELECT state_alpha, count(*) FROM ddb_features WHERE feature_class = 'Summit' GROUP BY state_alpha;

Hive는 결과를 즉시 반환하지 않습니다. 대신, MapReduce 작업을 제출하고, Hadoop 프레임워크가 이 작업을 처리합니다. Hive는 작업이 완료될 때까지 대기했다가 쿼리 결과를 표시합니다.

AK 2 AL 2 AR 2 AZ 3 CA 7 CO 2 CT 2 ID 1 KS 1 ME 2 MI 1 MT 3 NC 1 NE 1 NM 1 NY 2 OR 5 PA 1 TN 1 TX 1 UT 4 VA 1 VT 2 WA 2 WY 3 Time taken: 8.753 seconds, Fetched: 25 row(s)

작업 모니터링 및 취소

Hive는 Hadoop 작업을 시작하면 해당 작업의 출력을 표시합니다. 작업이 진행되는 동안 작업 완료 상태가 업데이트됩니다. 일부 경우에는 상태가 장시간 업데이트되지 않을 수도 있습니다. (할당된 읽기 용량 설정이 낮은 대규모 DynamoDB 테이블을 쿼리하는 경우 그럴 수 있습니다.)

작업을 완료 전에 취소해야 할 경우 언제든지 Ctrl+C를 입력하면 됩니다.