Amazon Redshift와 제로 ETL 통합을 사용할 때 고려할 사항 - Amazon Redshift

Amazon Redshift와 제로 ETL 통합을 사용할 때 고려할 사항

다음 고려 사항은 Amazon Redshift와의 제로 ETL 통합에 적용됩니다.

  • 대상 Amazon Redshift 데이터 웨어하우스는 다음 사전 요구 사항을 충족해야 합니다.

    • Amazon Redshift Serverless 또는 RA3 노드 유형(ra3.16xlarge, ra3.4xlarge 및 ra3.xlplus)을 실행 중입니다.

    • 암호화되어 있습니다(프로비저닝된 클러스터를 사용하는 경우).

    • 대/소문자 구분이 활성화되어 있습니다.

  • 통합이 구성된 데이터 웨어하우스에서는 향상된 VPC 지원을 활성화할 수 없습니다.

  • Amazon Redshift 데이터 웨어하우스에 대해 권한이 부여된 통합 소스인 소스를 삭제하면 연결된 모든 통합이 FAILED 상태로 전환됩니다.

  • 대상 데이터베이스는 읽기 전용입니다. 대상 데이터베이스에서는 테이블, 뷰 또는 구체화된 뷰를 만들 수 없습니다. 하지만 대상 데이터 웨어하우스의 다른 테이블에서는 구체화된 뷰를 사용할 수 있습니다.

  • 구체화된 뷰는 데이터베이스 간 쿼리에서 사용할 때 지원됩니다. 제로 ETL 통합에서 복제된 데이터로 구체화된 뷰를 새로 고치면 뷰가 완전히 새로 고쳐집니다. 증분 새로 고침, 자동 쿼리 재작성, 자동 새로 고침 및 자동화된 구체화된 뷰는 지원되지 않습니다. 제로 ETL 통합을 통해 복제된 데이터로 구체화된 뷰를 생성하는 방법에 대한 자세한 정보는 복제된 데이터로 구체화된 뷰 생성 섹션을 참조하세요.

  • Synced 상태인 대상 데이터 웨어하우스의 테이블만 쿼리할 수 있습니다. 자세한 내용은 제로 ETL 통합의 지표 단원을 참조하십시오.

  • Amazon Redshift는 UTF-8 문자만 허용하므로 소스에 정의된 데이터 정렬을 따르지 않을 수 있습니다. 정렬 및 비교 규칙이 다를 수 있으며, 이로 인해 결국 쿼리 결과가 변경될 수 있습니다.

  • Amazon Redshift VARCHAR 데이터 유형의 최대 길이는 65,535바이트입니다. 소스의 콘텐츠가 이 제한에 맞지 않으면 복제가 진행되지 않고 테이블이 실패 상태가 됩니다. 제로 ETL 통합 소스와 Amazon Redshift 데이터베이스 간의 데이터 유형 차이에 관한 자세한 내용은 Amazon Aurora 사용 설명서Aurora와 Amazon Redshift 간의 데이터 유형 차이 단원을 참조하세요.

  • 통합 원본의 테이블에 프라이머리 키가 있어야 합니다. 그렇지 않으면 Amazon Redshift의 대상 데이터 웨어하우스에 테이블을 복제할 수 없습니다.

    Aurora PostgreSQL-Compatible Edition에 프라이머리 키를 추가하는 방법에 대한 자세한 내용은 AWS 데이터베이스 블로그의 Amazon Redshift를 사용해 Amazon Aurora PostgreSQL 제로 ETL 통합을 생성하는 동안 프라이머리 키가 없는 테이블 처리를 참조하세요. Amazon Aurora MySQL 또는 RDS for MySQL에 프라이머리 키를 추가하는 방법에 대한 자세한 내용은 AWS 데이터베이스 블로그의 Amazon Redshift를 사용해 Amazon Aurora MySQL 또는 Amazon RDS for MySQL 제로 ETL 통합을 생성하는 동안 프라이머리 키가 없는 테이블 처리를 참조하세요.

  • Amazon Redshift와 Aurora PostgreSQL 및 RDS for MySQL 제로 ETL 통합의 경우 미리 보기에서 대상 데이터 웨어하우스를 만듭니다. 자세한 내용은 대상 Amazon Redshift 데이터 웨어하우스 생성 및 구성 단원을 참조하십시오.

  • 제로 ETL 통합은 트랜잭션 데이터 스토어의 데이터를 Amazon Redshift로 복제하는 동안에는 변환을 지원하지 않습니다. 데이터는 소스 데이터베이스에서 있는 그대로 복제됩니다. 하지만 Amazon Redshift에서 복제된 데이터에 변환을 적용할 수 있습니다.

  • 이는 Amazon Redshift에서 실행되는 다른 워크로드에 영향을 미칠 수 있습니다. 제로 ETL 통합이 다른 워크로드에 미치는 영향을 없애려면 제로 ETL 통합을 위해 별도의 엔드포인트를 사용하고, 데이터 공유를 통해 이 데이터에 액세스해야 하는 다른 엔드포인트와 데이터를 공유하는 것이 좋습니다.

  • 제로 ETL 통합은 Amazon Redshift에서 병렬 연결을 사용하여 실행됩니다. 이는 통합에서 데이터베이스를 생성한 사용자의 자격 증명을 사용하여 실행됩니다. 쿼리가 실행되면 동기화(쓰기) 중에 이러한 연결에 대한 동시성 확장이 시작되지 않습니다. (Amazon Redshift 클라이언트에서) 동시성 확장 읽기는 동기화된 객체에 지원됩니다.

통합 소스에도 적용되는 고려 사항은 다음 주제 중 하나를 참조하세요.

  • Aurora 소스의 경우 Amazon Aurora 사용 설명서의 제한 사항을 참조하세요.

  • Amazon RDS 소스의 경우 Amazon RDS 사용 설명서의 제한 사항을 참조하세요.