자습서: Amazon DynamoDB 및 Apache Hive 작업 - Amazon DynamoDB

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

자습서: Amazon DynamoDB 및 Apache Hive 작업

이 자습서에서는 Amazon EMR 클러스터를 시작한 다음 Apache Hive를 사용하여 DynamoDB 테이블에 저장된 데이터를 처리합니다.

Hive는 여러 소스의 데이터를 처리 및 분석할 수 있게 해주는, Hadoop용 데이터 웨어하우스 애플리케이션입니다. Hive는 SQL과 유사한 언어인 HiveQL을 제공합니다. 이 언어를 사용하면 Amazon EMR 클러스터에 로컬로 저장된 데이터 또는 외부 데이터 원본(예: Amazon DynamoDB)에 저장된 데이터로 작업할 수 있습니다.

자세한 내용은 Hive Tutorial을 참조하세요.

시작하기 전에

이 자습서를 이해하려면 다음이 필요합니다.

  • AWS 계정. 계정이 없을 경우 가입하기: AWS 단원을 참조하세요.

  • SSH 클라이언트(Secure Shell). SSH 클라이언트를 사용하여 Amazon EMR 클러스터의 리더 노드에 연결하고 대화형 명령을 실행합니다. SSH 클라이언트는 대부분의 Linux, Unix 및 Mac OS X 설치 시 기본적으로 사용됩니다. Windows 사용자는 SSH가 지원되는 PuTTY 클라이언트를 다운로드하여 설치하면 됩니다.

다음 단계

1단계: Amazon EC2 키 페어 생성