데이터 조인 - 아마존 QuickSight

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 조인

Amazon의 조인 인터페이스를 사용하여 하나 이상의 데이터 소스에서 객체를 QuickSight 조인할 수 있습니다. QuickSight Amazon을 사용하여 데이터를 결합하면 다른 소스의 데이터를 복제하지 않고도 서로 다른 데이터를 병합할 수 있습니다.

조인된 데이터 세트 유형

두 QuickSight 논리적 테이블 간에 조인이 수행되며, 각 논리적 테이블에는 데이터를 가져오는 방법에 대한 정보가 들어 있습니다. 에서 QuickSight 데이터셋을 편집할 때 페이지 상단의 조인 다이어그램에 각 논리적 테이블이 사각형 블록으로 표시됩니다.

조인된 데이터셋에는 동일 소스와 크로스 소스라는 두 가지 유형의 조인된 데이터셋이 있습니다 QuickSight. 데이터 세트에 조인이 없거나 다음 조건이 모두 충족되는 경우 데이터 세트는 동일 소스로 간주됩니다.

  • 논리적 테이블 중 데이터 원본을 참조하는 것이 있는 경우: QuickSight

    • 이 데이터셋의 모든 논리적 테이블은 동일한 QuickSight 데이터 원본을 참조해야 합니다. 두 개의 개별 QuickSight 데이터 원본이 동일한 기본 데이터베이스를 참조하는 경우에는 적용되지 않습니다. QuickSight 데이터 원본이 완전히 같아야 합니다. 단일 데이터 소스 사용에 대한 자세한 내용은 기존 데이터 소스를 사용하여 데이터 세트 생성을(를) 참조하십시오.

  • 논리적 테이블 중 부모 QuickSight 데이터셋인 데이터세트를 참조하는 것이 있는 경우:

    • 상위 데이터 세트는 직접 쿼리를 사용해야 합니다.

    • 부모 데이터셋은 동일한 QuickSight 데이터 소스를 참조해야 합니다.

위 조건이 충족되지 않는 경우 데이터 세트는 크로스 소스 조인으로 간주됩니다.

데이터 세트 조인에 관한 정보

동일 소스 데이터 세트 조인과 크로스 소스 데이터 세트 조인 모두 다음과 같은 제한이 있습니다.

조인된 데이터 세트에 포함할 수 있는 최대 테이블 수는 몇 개입니까?

조인된 모든 데이터 세트에는 최대 32개의 테이블이 포함될 수 있습니다.

조인된 데이터의 크기는 얼마나 되나요?

허용되는 최대 조인 크기는 사용되는 쿼리 모드와 쿼리 엔진에 따라 결정됩니다. 아래 목록은 조인할 테이블의 다양한 크기 제한에 대한 정보를 제공합니다. 크기 제한은 모든 보조 테이블을 합친 것에 적용됩니다. 기본 테이블에는 조인 크기 제한이 없습니다.

  • 동일 소스 테이블 — 테이블이 단일 쿼리 데이터 원본에서 생성된 경우 QuickSight 조인 크기에는 제한이 없습니다. 이렇게 해도 원본 쿼리 엔진에 있을 수 있는 조인 크기 제한이 무시되지는 않습니다.

  • 크로스 소스 데이터셋 — 이 유형의 조인에는 저장되지 않은 다양한 데이터 원본의 테이블이 포함됩니다. SPICE 이러한 유형의 조인의 경우 데이터세트에서 가장 큰 테이블을 QuickSight 자동으로 식별합니다. 다른 모든 보조 테이블의 총 크기는 1GB 미만이어야 합니다.

  • 데이터셋 저장 SPICE - 이 유형의 조인에는 모두 인제스트된 테이블이 포함됩니다. SPICE 이 조인에 있는 모든 보조 테이블의 총 크기는 20GB를 초과할 수 없습니다.

SPICE데이터세트 크기 계산에 대한 자세한 내용은 을 참조하십시오SPICE 데이터 세트 크기 추정.

조인된 데이터 세트에 직접 쿼리를 사용할 수 있습니까?

직접 쿼리 사용에 다른 제한이 없다는 전제 하에 동일 소스 데이터 세트는 직접 쿼리를 지원합니다. 예를 들어 S3 데이터 소스는 직접 쿼리를 지원하지 않으므로 동일한 소스의 S3 데이터세트를 계속 사용해야 합니다. SPICE

크로스 소스 데이터세트를 사용해야 합니다. SPICE

계산된 필드를 조인에 사용할 수 있습니까?

조인된 모든 데이터 세트는 계산된 필드를 사용할 수 있지만 계산된 필드는 조항에 사용할 수 없습니다.

조인에 지리 데이터를 사용할 수 있습니까?

동일한 소스 데이터셋은 지리 데이터 유형을 지원하지만 지리적 필드는 조항에 사용할 수 없습니다.

교차 소스 데이터 세트는 어떤 형태의 지리 데이터도 지원하지 않습니다.

데이터 소스 간 테이블 조인의 몇 가지 예는 AWS 빅 데이터 블로그의 Amazon 데이터 소스 간 조인 QuickSight 게시물을 참조하십시오.

조인 생성하기

데이터 세트에 사용할 테이블을 조인하려면 다음 절차를 따르십시오. 시작하기 전에 데이터를 가져오거나 데이터에 연결합니다. 사물 인터넷 (IoT) 데이터를 제외하고 QuickSight Amazon에서 지원하는 모든 데이터 소스 간에 조인을 생성할 수 있습니다. 예를 들어 Amazon S3 버킷에 쉼표로 구분된 값 (.csv) 파일, 테이블, 뷰, SQL 쿼리 또는 JSON 객체를 추가할 수 있습니다.

조인을 하나 이상 추가하기
  1. 작업할 데이터 세트를 엽니다.

  2. (선택 사항) 시작하기 전에 데이터 샘플을 기반으로 자동 생성된 미리 보기를 비활성화할지 여부를 결정합니다. 이 기능을 끄려면 오른쪽 상단의 자동 미리보기를 선택하세요. 기본적으로 활성화되어 있습니다.

  3. 아직 쿼리 모드를 선택하지 않았다면 쿼리 모드를 선택하세요.

    데이터 세트를 SPICE저장하도록 선택하거나 직접 쿼리를 선택하여 매번 라이브 데이터를 가져오십시오. SPICE 데이터 세트에 수동으로 업로드한 파일이 하나 이상 포함된 경우 데이터 세트가 SPICE에 자동으로 저장됩니다.

    원하는 SPICE경우 데이터가 에 인제스트됩니다. QuickSight 데이터 세트를 사용하는 시각적 객체는 데이터베이스 대신에 SPICE에서 쿼리를 실행합니다.

    직접 쿼리를 선택하면 데이터가 SPICE(으)로 수집되지 않습니다. 데이터 세트를 사용하는 시각적 객체는 SPICE 대신 데이터베이스에서 쿼리를 실행합니다.

    쿼리 모드를 선택하는 경우 시각 자료를 로드할 때 성능을 향상시키려면 해당하는 경우 조인에 고유 키를 설정해야 합니다.

  4. 데이터 준비 페이지에서 데이터 추가를 선택합니다.

  5. 데이터 추가 페이지가 열리면 다음 옵션 중 하나를 선택하고 다음 옵션 중 하나를 선택합니다.

    • 데이터 집합에서 데이터를 추가합니다.

      1. 데이터 세트를 선택합니다.

      2. 목록에서 데이터 세트를 선택합니다.

      3. 선택을 선택하세요.

    • 데이터 소스에서 데이터를 추가합니다.

      1. 데이터 소스를 선택합니다.

      2. 목록에서 데이터 소스를 선택합니다.

      3. 선택을 선택하세요.

      4. 목록에서 AMI를 선택합니다.

      5. 선택을 선택하세요.

    • 테이블을 여러 번 추가하여 셀프 조인을 생성합니다. 이름 뒤에 카운터가 나타납니다. Product, Product (2)Product (3)이 그 예입니다. 필드 또는 필터 섹션에 있는 필드 이름에는 동일한 카운터가 포함되어 있어 필드의 출처인 테이블의 인스턴스를 확인할 수 있습니다.

    • 파일 업로드를 선택하여 새 파일을 추가한 다음 조인할 파일을 선택합니다.

  6. (선택 사항) 사용자 지정 사용을 선택하여 쿼리 SQL 편집기를 열고 SQL 데이터 원본에 대한 쿼리를 작성합니다.

  7. (선택 사항) 데이터를 추가한 후 해당 메뉴 아이콘을 선택하여 각 테이블과 상호 작용합니다. 테이블을 드래그 앤 드롭하여 재정렬합니다.

    빨간색 점이 있는 아이콘은 이 조인을 구성해야 함을 나타냅니다. 아직 구성되지 않은 조인에는 빨간색 점 두 개가 나타납니다. 조인을 만들려면 첫 번째 조인 구성 아이콘을 선택합니다.

    Database icon labeled "Sale" connected to another icon with red dots indicating configuration needed.
  8. (선택 사항) 기존 조인을 변경하려면 두 테이블 사이의 조인 아이콘을 선택하여 조인 구성을 다시 엽니다.

    조인 구성 창이 열립니다. 조인 인터페이스를 사용하면 테이블 조인에 사용할 조인 유형 및 필드를 지정합니다.

  9. 화면 하단에서 다른 테이블의 필드와 동일하게 테이블의 필드를 설정할 수 있는 옵션이 있습니다.

    Join configuration interface showing fields to select and match from Sale and City tables.
    1. Join clauses(절 조인) 섹션에서 각 테이블에 대한 조인 열을 선택합니다.

      Join configuration interface showing City Key selection in dropdown and join clause setup.

      (선택 사항) 선택한 테이블이 여러 열에서 조인하는 경우 Add a new join clause(새 조인 절 추가)를 선택합니다. 이를 수행하면 조인 절에 또 다른 행이 추가되고, 조인할 다음 열 세트를 지정할 수 있습니다. 두 데이터 객체의 모든 조인 열을 식별할 때까지 이 절차를 반복합니다.

      Join configuration interface showing FeedbackDetails and New custom SQL columns with matching fields.
  10. 조인 구성 창에 있는 적용할 조인 종류를 선택합니다. 조인 필드가 하나 또는 두 테이블의 고유 키인 경우 고유 키 설정을 활성화하십시오. 고유 키는 직접 쿼리에만 적용되며 SPICE 데이터에는 적용되지 않습니다.

    조인 대한 자세한 내용은 조인 유형을(를) 참조하십시오.

    Join types diagram showing Inner, Left, Right, and Full, with Right highlighted as recommended.
  11. 적용을 선택하여 선택을 확인합니다.

    변경 없이 취소하려면 취소를 선택합니다.

  12. 작업 영역의 조인 아이콘이 변경되어 새 관계가 표시됩니다.

    Join icon showing a connection between two database symbols labeled Sale and City.
  13. (선택 사항) 필드 섹션에서 각 필드의 메뉴를 사용하여 다음 중 하나 이상을 수행할 수 있습니다.

    • 지리 공간 필드에 계층 추가.

    • 필드를 포함하거나 제외.

    • 필드 이름 및 설명 편집.

    • 데이터 유형을 변경.

    • 계산(계산된 필드) 추가.

    • 사용자에게만 액세스 허용을 선택하면 사용자만 볼 수 있습니다. 이는 이미 사용 중인 데이터 세트에 필드를 추가할 때 유용할 수 있습니다.

  14. (선택 사항) 필터 섹션에서 필터를 추가 또는 편집할 수 있습니다. 자세한 내용은 아마존의 데이터 필터링 QuickSight 단원을 참조하십시오.

조인 유형

QuickSight Amazon은 다음과 같은 조인 유형을 지원합니다.

  • 내부 조인

  • 왼쪽 및 오른쪽 외부 조인

  • 전체 외부 조인

이러한 조인 유형과 데이터의 관계를 자세히 살펴보겠습니다. 다음 예제 데이터에서 이름이 widgetsafety rating인 테이블을 사용합니다.

SELECT * FROM safety-rating rating_id safety_rating 1 A+ 2 A 3 A- 4 B+ 5 B SELECT * FROM WIDGET widget_id widget safety_rating_id 1 WidgetA 3 2 WidgetB 1 3 WidgetC 1 4 WidgetD 2 5 WidgetE 6 WidgetF 5 7 WidgetG

내부 조인

두 테이블 사이에서 일치하는 데이터만을 보고자 하는 경우 내부 조인( Two overlapping circles representing a Venn diagram or intersection concept. )을 사용합니다. 예를 들어, 다음 safety-ratingwidget 테이블에서 내부 조인을 수행하는 경우를 가정합니다.

다음 결과 세트에서 안전 등급이 없는 위젯은 제거되고 위젯과 연결되지 않은 안전 등급은 제거됩니다. 완벽하게 일치하는 행만 포함됩니다.

SELECT * FROM safety-rating INNER JOIN widget ON safety_rating.rating_id = widget.safety_rating_id rating_id safety_rating widget_id widget safety_rating_id 3 A- 1 WidgetA 3 1 A+ 2 WidgetB 1 1 A+ 3 WidgetC 1 2 A 4 WidgetD 2 5 B 6 WidgetF 5

왼쪽 및 오른쪽 외부 조인

왼쪽 또는 오른쪽 외부 조인이라고도 합니다. 한 테이블의 모든 데이터를 보고, 다른 테이블에서 일치하는 행만을 보고자 하는 경우 왼쪽( Two circles, one blue and one gray, partially overlapping to form a Venn diagram. ) 또는 오른쪽( Two circular icons: a gray one with a checkmark and a blue one with an arrow. ) 외부 조인을 사용합니다.

그래픽 인터페이스에서 어떤 테이블이 오른쪽 또는 왼쪽에 있는지 볼 수 있습니다. SQL명령문에서 첫 번째 테이블은 왼쪽에 있는 것으로 간주됩니다. 따라서 오른쪽 외부 조인과는 반대로 왼쪽 외부 조인을 선택하는 것은 테이블이 쿼리 도구에서 어떻게 배치되느냐에 따라서만 달라집니다.

예를 들어 safety-rating(왼쪽 테이블)과(와) widgets(오른쪽 테이블)에서 왼쪽 외부 조인( Two circles, one blue and one gray, partially overlapping to form a Venn diagram. )을 수행한다고 가정합니다. 이러한 경우 모든 safety-rating 행이 반환되고, 일치하는 widget 행만이 반환됩니다. 결과에 공백이 있는 경우 일치하는 데이터가 없는 것입니다.

SELECT * FROM safety-rating LEFT OUTER JOIN widget ON safety_rating.rating_id = widget.safety_rating_id rating_id safety_rating widget_id widget safety_rating_id 1 A+ 2 WidgetB 1 1 A+ 3 WidgetC 1 2 A 4 WidgetD 2 3 A- 1 WidgetA 3 4 B+ 5 B 6 WidgetF 5

오른쪽 외부 조인( Two circular icons: a gray one with a checkmark and a blue one with an arrow. )을 대신 사용하는 경우 동일한 순서로 테이블을 호출하여 safety-rating이(가) 왼쪽, widgets이(가) 오른쪽에 위치합니다. 이러한 경우 일치하는 safety-rating 행만이 반환되고, 모든 widget 행이 반환됩니다. 결과에 공백이 있는 경우 일치하는 데이터가 없는 것입니다.

SELECT * FROM safety-rating RIGHT OUTER JOIN widget ON safety_rating.rating_id = widget.safety_rating_id rating_id safety_rating widget_id widget safety_rating_id 3 A- 1 WidgetA 3 1 A+ 2 WidgetB 1 1 A+ 3 WidgetC 1 2 A 4 WidgetD 2 5 WidgetE 5 B 6 WidgetF 5 7 WidgetG

전체 외부 조인

완전 외부 조인이라고도 하지만 이 용어는 왼쪽 외부, 오른쪽 외부 또는 전체 외부 조인 중 하나를 의미할 수 있습니다. 의미를 정의하기 위해 전체 외부 조인이라는 용어를 사용합니다.

전체 외부 조인( Two blue circular icons overlapping to form a figure-eight shape. )을 사용하여 일치하는 데이터에 일치하지 않는 두 테이블 모두의 데이터를 봅니다. 조인의 유형에는 두 테이블 모두의 모든 행이 포함됩니다. 예를 들어, safety-ratingwidget 테이블에서 전체 외부 조인을 수행하는 경우 모든 행이 반환됩니다. 행은 일치하는 행과 연결되고, 모든 추가 데이터는 별도의 행에 포함됩니다. 결과에 공백이 있는 경우 일치하는 데이터가 없는 것입니다.

SELECT * FROM safety-rating FULL OUTER JOIN widget ON safety_rating.rating_id = widget.safety_rating_id rating_id safety_rating widget_id widget safety_rating_id 1 A+ 2 WidgetB 1 1 A+ 3 WidgetC 1 2 A 4 WidgetD 2 3 A- 1 WidgetA 3 4 B+ 5 B 6 WidgetF 5 5 WidgetE 7 WidgetG