Amazon Redshift 대상 노드 생성 - AWS Glue

Amazon Redshift 대상 노드 생성

필요한 권한

Amazon Redshift 데이터 대상을 사용하는 AWS Glue Studio 작업에는 추가 권한이 필요합니다. ETL 작업에 권한을 추가하는 방법에 대한 자세한 내용은 ETL 작업에 필요한 IAM 권한 검토를 참조하세요.

Amazon Redshift 연결을 사용하려면 다음 권한이 필요합니다.

  • redshift-data:ListSchemas

  • redshift-data:ListTables

Amazon Redshift 대상 노드 추가

Amazon Redshift 대상 노드를 생성하려면:
  1. 기존 Amazon Redshift 테이블을 대상으로 선택하거나 새 테이블 이름을 입력합니다.

  2. 데이터 대상 - Redshift 대상 노드를 사용하는 경우 다음 옵션 중에서 선택할 수 있습니다.

    • 추가 - 테이블이 이미 있는 경우 모든 새 데이터를 테이블에 삽입으로 덤프합니다. 테이블이 없으면 새로 생성한 후 새 데이터를 모두 삽입합니다.

      또한 대상 테이블의 기존 레코드를 업데이트(업서트)하려면 상자를 선택합니다. 테이블이 먼저 있어야 합니다. 그렇지 않으면 작업에 실패합니다.

    • 병합 - AWS Glue는 사용자가 지정한 조건에 따라 대상 테이블에 데이터를 추가하거나 업데이트합니다.

      참고

      AWS Glue에서 병합 작업을 사용하려면 Amazon Redshift 병합 기능을 활성화해야 합니다. Amazon Redshift 인스턴스에 대해 병합을 활성화하는 방법에 대한 지침은 MERGE(평가판)를 참조하세요.

      다음과 같은 옵션을 선택합니다.

      • 키 및 간단한 작업 선택 - 소스 데이터와 대상 데이터 세트 사이에서 일치하는 키로 사용할 열을 선택합니다.

        일치하는 경우 다음 옵션을 지정합니다.

        • 대상 데이터 세트의 레코드를 소스의 데이터로 업데이트합니다.

        • 대상 데이터 세트에서 레코드를 삭제합니다.

        일치하지 않는 경우 다음 옵션을 지정합니다.

        • 소스 데이터를 대상 데이터 세트에 새 행으로 삽입합니다.

        • 아무 작업 안 함.

      • 사용자 지정 MERGE 명령문 입력 - 그런 다음 병합 명령문 검증을 선택하여 명령문이 유효한지 여부를 검증할 수 있습니다.

    • 잘라내기 - 테이블이 이미 있는 경우 먼저 대상 테이블의 콘텐츠를 지워서 테이블 데이터를 잘라냅니다. 잘라내기에 성공하면 모든 데이터를 삽입합니다. 테이블이 없는 경우 테이블을 생성하고 모든 데이터를 삽입합니다. 잘라내기에 실패하면 작업에 실패합니다.

    • 삭제 - 테이블이 이미 있는 경우 테이블 메타데이터와 데이터를 삭제합니다. 삭제에 성공하면 모든 데이터를 삽입합니다. 테이블이 없는 경우 테이블을 생성하고 모든 데이터를 삽입합니다. 삭제에 실패하면 작업에 실패합니다.

    • 생성 - 기본 이름을 사용하여 새 테이블을 생성합니다. 테이블 이름이 이미 있는 경우 고유성을 유지하기 위해 이름에 job_datetime의 이름 접미사를 사용하는 새 테이블을 생성합니다. 그러면 모든 데이터가 새 테이블에 삽입됩니다. 테이블이 있는 경우 최종 테이블 이름에는 접미사가 추가됩니다. 테이블이 없는 경우 테이블이 생성됩니다. 어느 경우든 새 테이블이 생성됩니다.