Amazon Redshift에서 데이터 공유 개요 - Amazon Redshift

Amazon Redshift에서 데이터 공유 개요

데이터 공유를 사용하면 Amazon Redshift 클러스터에서 라이브 데이터를 안전하고 쉽게 공유할 수 있습니다.

데이터 공유 작업을 시작하고 AWS Management Console을 사용하여 datashare를 관리하는 방법에 대한 자세한 내용은 데이터 공유 작업 관리 섹션을 참조하세요.

Amazon Redshift의 데이터 공유 사용 사례

Amazon Redshift datashare는 다음과 같은 사용 사례에 특히 유용합니다.

  • 다양한 종류의 비즈니스 크리티컬 워크로드 지원 – 여러 비즈니스 인텔리전스(BI) 또는 분석 클러스터와 데이터를 공유하는 중앙 추출, 변환 및 로드(ETL) 클러스터를 사용합니다. 이 접근 방식은 개별 워크로드에 대한 읽기 워크로드 격리 및 차지백을 제공합니다. 가격 및 성능에 대한 워크로드별 요구 사항에 따라 개별 워크로드 컴퓨팅의 크기를 조정하고 확장할 수 있습니다.

  • 그룹 간 협업 사용 - 광범위한 분석, 데이터 과학 및 제품 간 영향 분석을 위해 팀과 비즈니스 그룹 간의 원활한 협업을 지원합니다.

  • 데이터를 서비스로 제공 – 조직 전체에서 데이터를 서비스로 공유합니다.

  • 환경 간 datashare – 개발, 테스트 및 프로덕션 환경 간에 데이터를 공유합니다. 다양한 세분화된 수준에서 데이터를 공유하여 팀 민첩성을 향상시킬 수 있습니다.

  • Amazon Redshift의 데이터에 대한 액세스 라이선스 부여 – 고객이 몇 분 안에 찾고, 구독하고, 쿼리할 수 있는 Amazon Redshift 데이터 집합을 AWS Data Exchange 카탈로그에 나열합니다.

데이터 공유 쓰기 액세스 사용 사례(미리 보기)

쓰기 데이터 공유에는 몇 가지 중요한 사용 사례가 있습니다.

  • 생산자에 대한 비즈니스 소스 데이터 업데이트 - 조직 전체에서 데이터를 서비스로 공유할 수 있지만, 이렇게 하면 소비자도 소스 데이터에 대한 작업을 수행할 수 있습니다. 예를 들어 소비자가 최신 값을 전달하거나 데이터 수신을 승인할 수 있습니다. 이는 비즈니스 사용 사례 중 몇 가지에 불과합니다.

  • 생산자에 추가 레코드 삽입 - 소비자가 원래 소스 데이터에 레코드를 추가할 수 있습니다. 필요한 경우 소비자가 추가한 것으로 표시할 수 있습니다.

데이터 공유에서 쓰기 작업을 수행하는 방법에 대한 구체적인 내용은 데이터에 대한 쓰기 액세스 공유(미리 보기)를 참조하세요.

Amazon Redshift에서 다양한 수준의 데이터 공유

Amazon Redshift를 사용하면 여러 수준에서 데이터를 공유할 수 있습니다. 이러한 수준에는 데이터베이스, 스키마, 테이블, 뷰(일반, 후기 바인딩 및 구체화된 뷰 포함) 및 SQL 사용자 정의 함수(UDF)가 포함됩니다. 지정된 데이터베이스에 대해 여러 datashare를 생성할 수 있습니다. datashare에는 공유가 생성되는 데이터베이스에 있는 여러 스키마의 객체가 포함될 수 있습니다.

datashare에 있어 이러한 유연성을 갖추면 세분화된 액세스 제어가 가능합니다. Amazon Redshift 데이터에 액세스해야 하는 다양한 사용자와 비즈니스에 맞게 이 제어를 조정할 수 있습니다.

Amazon Redshift에서 데이터 일관성 관리

Amazon Redshift는 모든 생산자 및 소비자 클러스터에서 트랜잭션 일관성을 제공하고 모든 소비자와 데이터의 일관된 최신 뷰를 공유합니다.

생산자 클러스터에서 데이터를 지속적으로 업데이트할 수 있습니다. 트랜잭션 내의 소비자 클러스터에 대한 모든 쿼리는 공유 데이터의 동일한 상태를 읽습니다. Amazon Redshift는 소비자 클러스터에서 트랜잭션이 시작된 후 커밋된 생산자 클러스터의 다른 트랜잭션에 의해 변경된 데이터를 고려하지 않습니다. 생산자 클러스터에서 데이터 변경이 커밋된 후 소비자 클러스터의 새 트랜잭션은 업데이트된 데이터를 즉시 쿼리할 수 있습니다.

일관성이 뛰어나 데이터 공유 중 잘못된 결과를 포함할 수도 있는 충실도가 낮은 비즈니스 보고서가 작성될 위험이 없습니다. 이 요소는 재무 분석이나 기계 학습 모델을 훈련하는 데 사용되는 데이터 집합을 준비하는 데 결과를 사용할 수 있는 경우에 특히 중요합니다.