Amazon Redshift Spectrum 시작하기 - Amazon Redshift

Amazon Redshift Spectrum 시작하기

이 튜토리얼에서는 Amazon Redshift Spectrum을 사용하여 Amazon S3의 파일에서 직접 데이터를 쿼리하는 방법에 대해 알아봅니다. 클러스터와 SQL 클라이언트가 이미 있다면 간단한 설정만으로 이 튜토리얼을 마칠 수 있습니다.

참고

Redshift Spectrum 쿼리에는 추가 요금이 발생합니다. 이 자습서에서 샘플 쿼리를 실행하는 요금은 정상 요금입니다. 요금에 대한 자세한 내용은 Redshift Spectrum 요금을 참조하세요.

사전 조건 

Redshift Spectrum을 사용하려면 Amazon Redshift 클러스터와 SQL 명령을 실행할 수 있도록 클러스터에 연결된 SQL 클라이언트가 있어야 합니다. 클러스터와 Amazon S3의 데이터 파일은 같은 AWS 리전에 있어야 합니다.

Amazon Redshift 클러스터를 생성하는 방법에 대한 자세한 내용은 Amazon Redshift 시작 안내서Amazon Redshift 프로비저닝 클러스터를 참조하세요. 클러스터에 연결하는 방법에 대한 자세한 내용은 Amazon Redshift 시작 안내서Amazon Redshift 데이터 웨어하우스에 연결 단원을 참조하세요.

이어지는 예시 중 일부에서 샘플 데이터는 미국 동부(버지니아 북부) 리전(us-east-1)에 있으므로 us-east-1에 있는 클러스터가 필요합니다. 또는 Amazon S3를 사용하여 다음 버킷 및 폴더의 데이터 객체를 클러스터가 위치한 AWS 리전의 버킷에 복사할 수 있습니다.

  • s3://redshift-downloads/tickit/spectrum/customers/*

  • s3://redshift-downloads/tickit/spectrum/sales_partition/*

  • s3://redshift-downloads/tickit/spectrum/sales/*

  • s3://redshift-downloads/tickit/spectrum/salesevent/*

다음과 유사한 Amazon S3 명령을 실행하여 미국 동부 (버지니아 북부)에 있는 샘플 데이터를 AWS 리전에 복사합니다. 명령을 실행하기 전에 Amazon S3 copy 명령과 일치하도록 버킷과 폴더를 버킷에 생성합니다. Amazon S3 copy 명령의 출력은 파일이 원하는 AWS 리전의 bucket-name에 복사되었음을 알려줍니다.

aws s3 cp s3://redshift-downloads/tickit/spectrum/ s3://bucket-name/tickit/spectrum/ --copy-props none --recursive

AWS CloudFormation을 사용하여 Amazon Redshift Spectrum 시작하기

다음 단계의 대안으로 Redshift Spectrum DataLake AWS CloudFormation 템플릿에 액세스하여 쿼리할 수 있는 Amazon S3 버킷으로 스택을 생성할 수 있습니다. 자세한 내용은 AWS CloudFormation 스택을 시작한 다음 Amazon S3에서 데이터를 쿼리합니다. 단원을 참조하십시오.

단계별로 Amazon Redshift Spectrum 시작하기

Amazon Redshift Spectrum 사용을 시작하려면 다음 단계를 따르세요.