2단계: Amazon EMR 클러스터 시작 - Amazon DynamoDB

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

2단계: Amazon EMR 클러스터 시작

이 단계에서는 Amazon EMR 클러스터를 구성하고 시작합니다. Hive와 DynamoDB용 스토리지 핸들러는 이미 클러스터에 설치되어 있을 것입니다.

  1. https://console.aws.amazon.com/emr에서 Amazon EMR 콘솔을 엽니다.

  2. Create Cluster를 선택합니다.

  3. Create Cluster - Quick Options 페이지에서 다음을 수행합니다.

    1. Cluster name에 클러스터 이름을 입력합니다(예: My EMR cluster).

    2. EC2 key pair에서 앞서 생성한 키 페어를 선택합니다.

    기타 설정은 기본값을 유지합니다.

  4. 클러스터 생성(Create cluster)을 선택합니다.

클러스터를 시작하는 데 몇 분이 걸릴 수 있습니다. Amazon EMR 콘솔의 Cluster Details(클러스터 세부 정보) 페이지에서 진행 상황을 모니터링할 수 있습니다.

Waiting 상태로 변경된 이후에 클러스터를 사용할 수 있습니다.

클러스터 로그 파일 및 Amazon S3

Amazon EMR 클러스터는 클러스터 상태 정보와 디버깅 정보를 포함하는 로그 파일을 생성합니다. Create Cluster - Quick Options(클러스터 생성 - 빠른 옵션)의 기본 설정에는 Amazon EMR 로깅 설정이 포함됩니다.

없는 경우 AWS Management Console에서 Amazon S3 버킷을 생성합니다. 버킷 이름은 aws-logs-account-id-region이며, 여기에서 account-id는 AWS 계정 번호, region은 클러스터를 시작한 리전입니다(예: aws-logs-123456789012-us-west-2).

참고

Amazon S3 콘솔을 사용하여 로그 파일을 볼 수 있습니다. 자세한 내용은 Amazon EMR 관리 가이드로그 파일 보기 단원을 참조하세요.

이 버킷을 로깅 이외에 용도로 사용할 수 있습니다. 예를 들어, 버킷을 Hive 스크립트를 저장하기 위한 위치로 사용하거나 Amazon DynamoDB에서 Amazon S3로 데이터를 내보낼 때 대상으로 사용할 수 있습니다.

다음 단계

3단계: 리더 노드에 연결