Amazon Redshift 소스 노드 생성 - AWS Glue

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon Redshift 소스 노드 생성

필요한 권한

Amazon Redshift 데이터 소스를 사용하는 AWS Glue Studio 작업에는 추가 권한이 필요합니다. ETL 작업에 권한을 추가하는 방법에 대한 자세한 내용은 ETL 작업에 필요한 IAM 권한 검토를 참조하세요.

Amazon Redshift 연결을 사용하려면 다음 권한이 필요합니다.

  • redshift-data:ListSchemas

  • redshift-data:ListTables

  • redshift-data:DescribeTable

  • redshift-data:ExecuteStatement

  • redshift-data:DescribeStatement

  • redshift-data:GetStatementResult

Amazon Redshift 데이터 소스 추가

데이터 소스 - Amazon Redshift 노드를 추가하려면:
  1. Amazon Redshift 액세스 유형을 선택합니다.

    • 직접 데이터 연결(권장) - Amazon Redshift 데이터에 직접 액세스하려면 이 옵션을 선택합니다. 이 옵션은 권장 옵션이며 기본값이기도 합니다.

    • Data Catalog tables - 사용하려는 데이터 카탈로그 테이블이 있는 경우 이 옵션을 선택합니다.

  2. 직접 데이터 연결을 선택하는 경우 Amazon Redshift 데이터 소스의 연결을 선택합니다. 이 경우 연결이 이미 존재하며 기존 연결 중에서 선택할 수 있다고 가정합니다. 연결을 생성해야 하는 경우 Redshift 연결 생성을 선택합니다. 자세한 내용은 커넥터 및 연결 사용 개요를 참조하세요.

    연결을 선택한 후에는 속성 보기를 클릭하여 연결 속성을 볼 수 있습니다. URL, 보안 그룹, 서브넷, 가용 영역, 설명, 생성 날짜(UTC) 및 최종 업데이트(UTC) 타임스탬프를 비롯한 연결 정보가 표시됩니다.

  3. 다음과 같은 Amazon Redshift 소스 옵션을 선택합니다.

    • 단일 테이블 선택 - 단일 Amazon Redshift 테이블에서 액세스하려는 데이터가 들어 있는 테이블입니다.

    • 사용자 지정 쿼리 입력 - 사용자 지정 쿼리를 기반으로 여러 Amazon Redshift 테이블의 데이터 세트에 액세스할 수 있습니다.

  4. 단일 테이블을 선택한 경우 Amazon Redshift 스키마를 선택합니다. 선택할 수 있는 스키마 목록은 선택한 테이블에 따라 결정됩니다.

    또는 사용자 지정 쿼리 입력을 선택합니다. 여러 Amazon Redshift 테이블에서 사용자 지정 데이터 세트에 액세스하려면 이 옵션을 선택합니다. 이 옵션을 선택하는 경우 Amazon Redshift 쿼리를 입력합니다.

    Amazon Redshift 서버리스 환경에 연결할 때 사용자 지정 쿼리에 다음 권한을 추가합니다.

    GRANT SELECT ON ALL TABLES IN <schema> TO PUBLIC

    스키마 추론을 선택하여 입력한 쿼리를 기반으로 스키마를 읽을 수 있습니다. Redshift 쿼리 편집기 열기를 선택하여 Amazon Redshift 쿼리를 입력할 수도 있습니다. 자세한 내용은 쿼리 편집기를 사용하여 데이터베이스 쿼리을 참조하세요.

  5. 성능 및 보안에서 Amazon S3 스테이징 디렉터리와 IAM 역할을 선택합니다.

    • Amazon S3 스테이징 디렉터리 - 데이터를 임시로 스테이징할 Amazon S3 위치를 선택합니다.

    • IAM 역할 - 선택한 Amazon S3 위치에 기록할 수 있는 IAM 역할을 선택합니다.

  6. 사용자 지정 Redshift 파라미터 - 선택 사항에서 파라미터와 값을 입력합니다.