Amazon Redshift에서 연합 쿼리를 사용하여 데이터 쿼리 - Amazon Redshift

Amazon Redshift에서 연합 쿼리를 사용하여 데이터 쿼리

Amazon Redshift에서 연합 쿼리를 사용하면 운영 데이터베이스, 데이터 웨어하우스 및 데이터 레이크에서 데이터를 쿼리하고 분석할 수 있습니다. 연합 쿼리 기능을 사용하면 외부 데이터베이스의 실시간 데이터에 대한 Amazon Redshift의 쿼리를 Amazon Redshift 및 Amazon S3 환경의 쿼리와 통합할 수 있습니다. 연합 쿼리는 Amazon RDS for PostgreSQL, Amazon Aurora PostgreSQL 호환 버전, Amazon RDS for MySQL 및 Amazon Aurora MySQL 호환 버전의 외부 데이터베이스와 함께 작동할 수 있습니다.

연합 쿼리를 사용하면 실시간 데이터를 BI(비즈니스 인텔리전스) 및 보고 애플리케이션의 일부로 통합할 수 있습니다. 예를 들어 Amazon Redshift에 대한 데이터 수집을 더 쉽게 만들려면 연합 쿼리를 사용하여 다음을 수행할 수 있습니다.

  • 운영 데이터베이스를 직접 쿼리합니다.

  • 변환을 신속하게 적용합니다.

  • 복잡한 추출, 변환, 로드(ETL) 파이프라인 없이 대상 테이블에 데이터를 로드합니다.

네트워크를 통한 데이터 이동을 줄이고 성능을 향상시키기 위해 Amazon Redshift는 연합 쿼리에 대한 컴퓨팅의 일부를 원격 운영 데이터베이스에 직접 배포합니다. 또한 Amazon Redshift는 병렬 처리 용량을 사용하여 필요에 따라 이러한 쿼리 실행을 지원합니다.

페더레이션 쿼리를 실행하면 Amazon Redshift는 먼저 리더 노드에서 RDS 또는 Aurora DB 클러스터 DB 인스턴스로 클라이언트 연결을 설정하여 테이블 메타데이터를 검색합니다. Amazon Redshift는 컴퓨팅 노드에서 조건자를 푸시다운하여 하위 쿼리를 실행하고 결과 행을 검색합니다. 그런 다음 Amazon Redshift는 추가 처리를 위해 컴퓨팅 노드 간에 결과 행을 배포합니다.

Amazon Aurora PostgreSQL 데이터베이스 또는 Amazon RDS for PostgreSQL 데이터베이스로 전송된 쿼리에 대한 세부 정보가 시스템 뷰 SVL_FEDERATED_QUERY에 기록됩니다.