Amazon의 기존 데이터세트를 사용하여 데이터세트 생성 QuickSight - 아마존 QuickSight

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon의 기존 데이터세트를 사용하여 데이터세트 생성 QuickSight

QuickSightAmazon에서 데이터세트를 생성한 후 이를 소스로 사용하여 추가 데이터세트를 생성할 수 있습니다. 이렇게 하면 상위 데이터 세트에 포함된 모든 데이터 준비(예: 조인 또는 계산된 필드)가 보관됩니다. 새 데이터 조인 및 데이터 필터링과 같은 추가 준비를 새 하위 데이터 세트의 데이터에 추가할 수 있습니다. 또한 하위 데이터 세트에 대한 자체 데이터 새로 고침 일정을 설정하고 이를 사용하는 대시보드 및 분석을 추적할 수 있습니다.

RLS 규칙이 소스로 활성화된 데이터 세트를 사용하여 만든 하위 데이터 세트는 상위 데이터 세트의 RLS 규칙을 상속합니다. 더 큰 상위 데이터 세트에서 하위 데이터 세트를 만드는 사용자는 상위 데이터 세트에서 액세스할 수 있는 데이터만 볼 수 있습니다. 그런 다음 상속된 RLS 규칙 외에도 새 하위 데이터 세트에 더 많은 RLS 규칙을 추가하여 새 데이터 세트에 있는 데이터에 액세스할 수 있는 사용자를 추가로 관리할 수 있습니다. Direct Query에서 RLS 규칙을 활성화한 데이터 세트에서만 하위 데이터 세트를 만들 수 있습니다.

기존 데이터세트에서 데이터세트를 생성하면 다음과 같은 QuickSight 이점이 있습니다.

  • 데이터 세트의 중앙 관리 - 데이터 엔지니어는 조직 내 여러 팀의 요구에 맞게 쉽게 확장할 수 있습니다. 이를 위해 조직의 주요 데이터 모델을 설명하는 몇 가지 범용 데이터 세트를 개발하고 유지 관리할 수 있습니다.

  • 데이터 원본 관리 감소 — 비즈니스 분석가 (BA) 는 데이터베이스 액세스를 요청하고, 데이터베이스 자격 증명을 관리하고, 적절한 테이블을 찾고, 데이터 새로 고침 일정을 관리하는 데 많은 시간과 노력을 들이는 경우가 많습니다. QuickSight 기존 데이터 세트를 기반으로 새 데이터 세트를 구축하면 BA가 데이터베이스의 원시 데이터로 처음부터 시작할 필요가 없습니다. 큐레이션된 데이터로 시작할 수 있습니다.

  • 사전 정의된 주요 지표 - 데이터 엔지니어는 기존 데이터 세트에서 데이터 세트를 생성하여 회사의 여러 조직 전반에서 중요한 데이터 정의를 중앙에서 정의하고 유지할 수 있습니다. 매출 성장과 순 한계 수익률을 예로 들 수 있습니다. 이 기능을 사용하면 데이터 엔지니어가 해당 정의의 변경 내용을 배포할 수도 있습니다. 이 접근 방식을 통해 비즈니스 분석가는 올바른 데이터를 보다 빠르고 안정적으로 시각화하는 작업을 시작할 수 있습니다.

  • 데이터를 사용자 지정하는 유연성 - 기존 데이터 세트에서 데이터 세트를 생성함으로써 비즈니스 분석가는 자신의 비즈니스 요구 사항에 맞게 데이터 세트를 보다 유연하게 사용자 지정할 수 있습니다. 이를 통해 다른 팀의 데이터가 손상될 염려를 피할 수 있습니다.

예를 들어 데이터 엔지니어 5명으로 구성된 전자 상거래 중앙 팀의 일원이라고 가정해 보겠습니다. 팀과 함께 데이터베이스의 판매, 주문, 취소 및 반품 데이터에 액세스할 수 있습니다. 스키마를 통해 18개의 다른 차원 테이블을 결합하여 QuickSight 데이터셋을 만들었습니다. 팀에서 만든 주요 지표는 계산된 필드인 주문 제품 판매(OPS)입니다. 정의는 다음과 같습니다. OPS = 제품 수량 x 가격.

귀사의 팀은 8개국의 10개 팀에 소속된 100명 이상의 비즈니스 분석가에게 서비스를 제공합니다. 이들은 쿠폰 팀, 아웃바운드 마케팅 팀, 모바일 플랫폼 팀, 추천 팀입니다. 이 모든 팀은 OPS 지표를 기반으로 자체 비즈니스 라인을 분석합니다.

수백 개의 연결되지 않은 데이터 세트를 수동으로 만들고 유지 관리하는 대신, 팀은 데이터 세트를 재사용하여 조직 전체의 팀을 위한 여러 수준의 데이터 세트를 만듭니다. 이렇게 하면 데이터 관리가 중앙 집중화되고 각 팀이 각자의 필요에 맞게 데이터를 사용자 지정할 수 있습니다. 이와 동시에 지표 정의 업데이트와 같은 데이터 업데이트가 동기화되고 행 수준 및 열 수준의 보안이 유지됩니다. 예를 들어, 조직의 개별 팀이 중앙화된 데이터 세트를 사용할 수 있습니다. 그런 다음 팀별 데이터와 결합하여 새 데이터세트를 만들고 그 위에 분석을 구축할 수 있습니다.

주요 OPS 지표를 사용하는 것 외에도 조직의 다른 팀은 사용자가 만든 중앙 집중식 데이터 세트의 열 메타데이터를 재사용할 수 있습니다. 예를 들어 데이터 엔지니어링 팀은 이름, 설명, 데이터 유형 및 폴더와 같은 메타데이터를 중앙 집중식 데이터 세트에 정의할 수 있습니다. 이후의 모든 팀에서 이 데이터를 사용할 수 있습니다.

참고

QuickSight Amazon은 단일 데이터세트에서 최대 두 레벨의 데이터세트를 추가로 생성할 수 있도록 지원합니다.

예를 들어 상위 데이터 세트에서 하위 데이터 세트를 생성한 다음 총 3개의 데이터 세트 수준에 대한 최하위 데이터 세트를 생성할 수 있습니다.

기존 데이터 세트에서 데이터 세트 생성

기존 데이터 세트에서 데이터 세트를 생성하려면 다음 절차를 따르십시오.

기존 데이터 세트에서 데이터 세트 생성하기
  1. QuickSight 시작 페이지의 왼쪽 창에서 Datasets를 선택합니다.

  2. 데이터 세트 페이지에서 새 데이 터세트를 만드는 데 사용할 데이터 세트를 선택합니다.

  3. 해당 데이터 세트에 대해 열리는 페이지에서 분석에 사용의 드롭다운 메뉴를 선택한 다음 데이터 세트에서 사용을 선택합니다.

    데이터 세트에 사용합니다.

    데이터 준비 페이지가 열리고 계산된 필드, 조인, 보안 설정을 비롯한 상위 데이터 세트의 모든 항목이 미리 로드됩니다.

  4. 표시되는 데이터 준비 페이지에서 왼쪽 하단의 쿼리 모드에서 데이터 세트에 원본 상위 데이터 세트의 변경 사항 및 업데이트를 가져오는 방법을 선택합니다. 다음과 같은 옵션을 선택할 수 있습니다.

    • 직접 쿼리 - 기본 쿼리 모드입니다. 이 옵션을 선택하면 관련 데이터 세트, 분석 또는 대시보드를 열 때 이 데이터 세트의 데이터가 자동으로 새로 고쳐집니다. 단, 다음 제한 사항이 적용됩니다.

      • 상위 데이터 세트에서 직접 쿼리를 허용하는 경우 하위 데이터 세트에서 직접 쿼리 모드를 사용할 수 있습니다.

      • 조인에 상위 데이터 세트가 여러 개 있는 경우 모든 부모가 동일한 기본 데이터 소스에서 가져온 경우에만 하위 데이터 세트에 대한 직접 쿼리 모드를 선택할 수 있습니다. 동일한 Amazon Redshift 연결을 예로 들 수 있습니다.

      • 단일 SPICE 상위 데이터 세트에 대해 직접 쿼리가 지원됩니다. 조인의 여러 SPICE 상위 데이터 세트에는 지원되지 않습니다.

    • SPICE - 이 옵션을 선택하면 새 데이터 세트가 상위 데이터 세트와 동기화되도록 일정을 설정할 수 있습니다. 데이터 세트의 SPICE 새로 고침 일정 만들기에 대한 자세한 내용은 SPICE 데이터 새로 고침을(를) 참조하십시오.

  5. (선택 사항) 분석을 위해 데이터를 준비합니다. 데이터 준비에 대한 자세한 내용은 아마존에서 데이터 준비 QuickSight을(를) 참조하십시오.

  6. (선택 사항) 행 수준 또는 열 수준 보안(RLS/CLS)을 설정하여 데이터 세트에 대한 액세스를 제한합니다. ELS 설정에 대한 자세한 내용은 사용자 기반 규칙과 함께 행 수준 보안(RLS)을 사용하여 데이터 세트 액세스 제한을(를) 참조하십시오. CLS 설정에 대한 자세한 내용은 열 수준 보안(CLS)을 사용하여 데이터 세트 액세스 제한을(를) 참조하십시오.

    참고

    하위 데이터 세트에만 RLS/CLS를 설정할 수 있습니다. 상위 데이터 세트의 RLS/CLS는 지원되지 않습니다.

  7. 작업을 마치면 저장 및 게시를 선택하여 변경 내용을 저장하고 새 하위 데이터 세트를 게시합니다. 또는 게시 및 시각화를 선택하여 새 하위 데이터 세트를 게시하고 데이터 시각화를 시작합니다.