명령줄을 사용하여 Amazon Redshift로 데이터 복사 - AWS Data Pipeline

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

명령줄을 사용하여 Amazon Redshift로 데이터 복사

이 자습서는 Amazon S3에서 Amazon Redshift로 데이터를 복사하는 방법을 설명합니다. Amazon Redshift에 새 테이블을 생성한 다음 AWS Data Pipeline을(를) 사용하여 CSV 형식의 샘플 입력 데이터가 있는 퍼블릭 Amazon S3 버킷에서 이 테이블로 데이터를 전송합니다. 소유하고 있는 Amazon S3 버킷에 로그가 저장됩니다.

Amazon S3는 클라우드에 데이터를 저장하는 웹 서비스입니다. 자세한 내용은 Amazon Simple Storage Service 사용 설명서를 참조하세요. Amazon Redshift는 클라우드의 데이터 웨어하우스 서비스입니다. 자세한 내용은 Amazon Redshift 관리 가이드의 섹션을 참조하세요.

필수 조건

시작하기 전에 다음 단계를 완료해야 합니다.

  1. 명령줄 인터페이스(CLI)를 설치하고 구성합니다. 자세한 내용은 액세스 AWS Data Pipeline 섹션을 참조하세요.

  2. DataPipelineDefaultRoleDataPipelineDefaultResourceRole이라는 이름의 IAM 역할이 존재하는지 확인하십시오. AWS Data Pipeline 콘솔은 자동으로 이러한 역할을 생성합니다. AWS Data Pipeline 콘솔을 한 번 이상 사용하지 않았다면 수동으로 이러한 역할을 생성해야 합니다. 자세한 내용은 AWS Data Pipeline의 IAM 역할 섹션을 참조하세요.

  3. Amazon Redshift에서 COPY명령을 설정하며, 그 이유는 AWS Data Pipeline내에서 복사를 수행할 때 이와 동일한 옵션이 작동해야 하기 때문입니다. 자세한 내용은 시작하기 전: COPY 옵션 구성 및 데이터 로드을 참조하세요.

  4. Amazon Redshift 데이터베이스를 설정하십시오. 자세한 내용은 파이프라인 설정, 보안 그룹 생성, Amazon Redshift 클러스터 생성 섹션을 참조하세요.