Amazon Redshift 프로비저닝 클러스터 - Amazon Redshift

Amazon Redshift 프로비저닝 클러스터

Amazon Redshift를 처음 사용하는 경우 이 자습서를 통해 Amazon Redshift 클러스터 사용을 시작할 수 있습니다. Redshift 서버리스 사용을 시작하려면 Amazon Redshift Serverless 단원을 참조하세요.

Amazon Redshift 프로비저닝 콘솔을 생성하고 로그인한 후 클러스터, 노드, 데이터베이스를 포함한 Amazon Redshift 객체를 생성하고 관리할 수 있습니다. 또한 SQL 클라이언트를 사용하여 쿼리를 실행하고, 쿼리를 보고, 기타 SQL 데이터 정의 언어(DDL) 및 데이터 조작 언어(DML) 작업을 수행할 수도 있습니다.

중요

이 연습에서 프로비저닝하는 클러스터는 실제 환경에서 실행됩니다. 실행되는 동안에는 AWS 계정에 요금이 발생합니다. 요금 정보는 Amazon Redshift 요금 페이지를 참조하세요.

불필요한 과금을 피하려면 클러스터를 사용한 후 삭제해야 합니다. 자습서의 마지막 단계에서 그 방법을 설명합니다.

AWS Management Console에 로그인한 후 https://console.aws.amazon.com/redshiftv2/에서 Amazon Redshift 콘솔을 엽니다.

Amazon Redshift 콘솔 사용을 시작하려면 먼저 프로비저닝된 클러스터 대시보드로 이동하는 것이 좋습니다.

구성에 따라 Amazon Redshift 프로비저닝 콘솔의 탐색 창에 다음 항목이 나타납니다.

  • Redshift 서버리스 – Amazon Redshift 프로비저닝된 클러스터를 설정, 조정 및 관리할 필요 없이 데이터에 액세스하고 분석합니다.

  • 프로비저닝된 클러스터 대시보드 - AWS 리전의 클러스터 목록을 보고, 클러스터 지표쿼리 개요에서 지표 데이터(예: CPU 사용률) 및 쿼리 정보에 대한 인사이트를 확인할 수 있습니다. 이를 통해 지정된 시간 범위 동안 성능 데이터가 비정상인지 판단할 수 있습니다.

  • 클러스터 - 이 AWS 리전의 클러스터 목록을 확인하거나, 쿼리를 시작할 클러스터를 선택하거나, 클러스터 관련 작업을 수행합니다. 이 페이지에서 새 클러스터를 생성할 수도 있습니다.

  • 쿼리 편집기 – Amazon Redshift 클러스터에 호스팅된 데이터베이스에 대한 쿼리를 실행합니다. 대신 쿼리 에디터 v2를 사용하는 것이 좋습니다.

  • 쿼리 에디터 v2 – Amazon Redshift 쿼리 에디터 v2는 Amazon Redshift 데이터 웨어하우스에서 쿼리를 작성하고 실행하는 별도의 웹 기반 SQL 클라이언트 애플리케이션입니다. 결과를 차트로 시각화하고 팀의 다른 사용자와 쿼리를 공유하여 협업할 수 있습니다.

  • 쿼리 및 로드(Queries and loads) - 최근 쿼리 목록과 각 쿼리의 SQL 텍스트와 같은 참조 또는 문제 해결을 위한 정보를 제공합니다.

  • Datashare – 생산자 계정 관리자로서 소비자 계정에 datashare 액세스 권한을 부여하거나 어떠한 액세스 권한도 부여하지 않도록 선택할 수 있습니다. 권한이 부여된 데이터 공유를 사용하기 위해 소비자 계정 관리자는 데이터 공유를 전체 AWS 계정 또는 계정의 특정 클러스터 네임스페이스와 연결할 수 있습니다. 관리자가 datashare를 거부할 수도 있습니다.

  • 제로 ETL 통합 - 지원되는 소스에 작성된 트랜잭션 데이터를 Amazon Redshift에서 사용할 수 있도록 통합을 관리합니다.

  • IAM Identity Center 연결 - Amazon Redshift와 IAM Identity Center 간의 연결을 구성합니다.

  • 구성(Configurations) – JDBC(Java Database Connectivity) 및 ODBC(Open Database Connectivity) 연결을 통해 SQL 클라이언트 도구에서 Amazon Redshift 클러스터로 연결합니다. Amazon Redshift 관리형 Virtual Private Cloud(VPC) 엔드포인트를 설정할 수도 있습니다. 이렇게 하면 클러스터가 포함된 Amazon VPC 서비스를 기반으로 하는 VPC와 클라이언트 도구를 실행하는 다른 VPC 간에 프라이빗 연결이 제공됩니다.

  • AWS 파트너 통합 - 지원되는 AWS 파트너와의 통합을 생성합니다.

  • Advisor - 최적화의 우선순위를 지정하기 위해 Amazon Redshift 클러스터에 적용할 수 있는 변경 사항에 대한 구체적인 권장 사항을 제공합니다.

  • AWS Marketplace - Amazon Redshift와 함께 작동하는 다른 도구 또는 AWS 서비스에 대한 정보를 제공합니다.

  • 경보(Alarms) - 클러스터 지표에 대한 경보를 생성하여 성능 데이터를 보고 지정한 기간 동안 지표를 추적합니다.

  • 이벤트(Events) - 이벤트를 추적하고 이벤트가 발생한 날짜, 설명 또는 이벤트 소스와 같은 정보에 대한 보고서를 가져옵니다.

  • 새로운 소식(What's new) – 새로운 Amazon Redshift 기능과 제품 업데이트를 봅니다.

이 자습서에서는 다음 단계를 수행합니다.

이 튜토리얼의 단계는 다음에 약술되어 있습니다.

AWS에 가입

아직 AWS 계정이 없다면 가입하세요. 계정이 이미 있는 경우 이 사전 조건 단계를 건너뛰고 기존 계정을 사용할 수 있습니다.

  1. https://portal.aws.amazon.com/billing/signup을 엽니다.

  2. 온라인 지시 사항을 따릅니다.

    등록 절차 중 전화를 받고 전화 키패드로 확인 코드를 입력하는 과정이 있습니다.

    AWS 계정 루트 사용자에 가입하면 AWS 계정 루트 사용자가 생성됩니다. 루트 사용자에게는 계정의 모든 AWS 서비스 및 리소스에 액세스할 권한이 있습니다. 보안 모범 사례는 사용자에게 관리 액세스 권한을 할당하고, 루트 사용자만 사용하여 루트 사용자 액세스 권한이 필요한 작업을 수행하는 것입니다.

방화벽 규칙 확인

참고

이 자습서에서는 클러스터가 기본 포트 5439를 사용하고 Amazon Redshift 쿼리 에디터 v2를 사용하여 SQL 명령을 실행할 수 있다고 가정합니다. 환경에 필요할 수 있는 네트워킹 구성 또는 SQL 클라이언트 설정에 대해서는 자세히 다루지 않습니다.

일부 환경에서는 Amazon Redshift 클러스터를 시작할 때 포트를 지정합니다. 또한 보안 그룹에 인바운드 수신 규칙을 생성하여 포트를 통해 클러스터에 대한 액세스를 허용합니다.

클라이언트 컴퓨터가 방화벽을 사용하는 경우 사용할 수 있는 개방된 포트를 알아야 합니다. 이 개방된 포트를 사용하여 SQL 클라이언트 도구에서 클러스터에 연결하고 쿼리를 실행할 수 있습니다. 개방된 포트를 모르는 경우 사용자의 네트워크 방화벽 규칙을 알고 있는 사람과 작업하여 방화벽의 개방된 포트를 확인합니다.

Amazon Redshift는 기본적으로 포트 5439를 사용하지만, 포트가 방화벽에서 막혀 있으면 연결이 실패합니다. Amazon Redshift 클러스터의 포트 번호는 생성한 후에는 변경할 수 없습니다. 따라서 시작 프로세스 중에 환경에서 작업하는 개방된 포트를 지정해야 합니다.