명령줄을 사용하여 Amazon Redshift로 데이터 복사

이 자습서는 Amazon S3에서 Amazon Redshift로 데이터를 복사하는 방법을 설명합니다. Amazon Redshift에서 새 테이블을 생성한 다음 AWS Data Pipeline 를 사용하여 CSV 형식의 샘플 입력 데이터가 포함된 퍼블릭 Amazon S3 버킷에서이 테이블로 데이터를 전송합니다. 소유하고 있는 Amazon S3 버킷에 로그가 저장됩니다.

Amazon S3는 클라우드에 데이터를 저장하는 웹 서비스입니다. 자세한 내용은 Amazon Simple Storage Service 사용 설명서를 참조하세요. Amazon Redshift는 클라우드의 데이터 웨어하우스 서비스입니다. 자세한 내용은 Amazon Redshift 관리 가이드의 섹션을 참조하십시오.

사전 조건

시작하기 전에 다음 단계를 완료해야 합니다.

명령줄 인터페이스(CLI)를 설치하고 구성합니다. 자세한 내용은 액세스 AWS Data Pipeline 단원을 참조하십시오.
DataPipelineDefaultRole 및 DataPipelineDefaultResourceRole이라는 이름의 IAM 역할이 존재하는지 확인하십시오. AWS Data Pipeline 콘솔은 이러한 역할을 자동으로 생성합니다. AWS Data Pipeline 콘솔을 한 번 이상 사용하지 않은 경우 이러한 역할을 수동으로 생성해야 합니다. 자세한 내용은 에 대한 IAM 역할 AWS Data Pipeline 단원을 참조하십시오.
Amazon Redshift에서 COPY명령을 설정하며, 그 이유는 AWS Data Pipeline내에서 복사를 수행할 때 이와 동일한 옵션이 작동해야 하기 때문입니다. 자세한 내용은 시작하기 전: COPY 옵션 구성 및 데이터 로드 단원을 참조하세요.
Amazon Redshift 데이터베이스를 설정하십시오. 자세한 내용은 파이프라인 설정, 보안 그룹 생성, Amazon Redshift 클러스터 생성 단원을 참조하십시오.

업무

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

시작하기 전: 파이프라인, 보안, 클러스터 설정

JSON 형식으로 파이프라인 정의