아마존 Redshift용 아마존 DataZone 데이터 소스 생성 및 실행 - 아마존 DataZone

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

아마존 Redshift용 아마존 DataZone 데이터 소스 생성 및 실행

DataZoneAmazon에서는 Amazon Redshift 데이터 웨어하우스에서 데이터베이스 테이블 및 뷰의 기술 메타데이터를 가져오기 위해 Amazon Redshift 데이터 소스를 생성할 수 있습니다. Amazon Redshift에 아마존 DataZone 데이터 소스를 추가하려면 소스 데이터 웨어하우스가 Amazon Redshift에 이미 있어야 합니다.

Amazon Redshift 데이터 소스를 생성하고 실행하면 소스 Amazon Redshift 데이터 웨어하우스의 자산을 Amazon 프로젝트 인벤토리에 추가합니다. DataZone Amazon Redshift 데이터 소스를 정해진 일정에 따라 또는 필요에 따라 실행하여 자산의 기술 메타데이터를 생성하거나 업데이트할 수 있습니다. 데이터 소스 실행 중에 프로젝트 인벤토리 자산을 Amazon DataZone 카탈로그에 게시하여 모든 도메인 사용자가 검색할 수 있도록 할 수도 있습니다. 비즈니스 메타데이터를 편집한 후 인벤토리 자산을 게시할 수도 있습니다. 도메인 사용자는 게시된 자산을 검색 및 검색하고 해당 자산에 대한 구독을 요청할 수 있습니다.

Amazon Redshift 데이터 소스를 추가하려면
  1. Amazon DataZone 데이터 포털 URL로 이동하여 싱글 사인온 (SSO) 또는 자격 증명을 사용하여 로그인합니다. AWS Amazon DataZone 관리자인 경우 https://console.aws.amazon.com/datazone 에서 Amazon DataZone 콘솔로 이동하여 도메인이 생성된 AWS 계정 위치로 로그인한 다음 Open data portal을 선택할 수 있습니다.

  2. 상단 탐색 창에서 프로젝트 선택을 선택하고 데이터 소스를 추가할 프로젝트를 선택합니다.

  3. 프로젝트의 데이터 탭으로 이동합니다.

  4. 왼쪽 탐색 창에서 데이터 소스를 선택한 다음 데이터 원본 만들기를 선택합니다.

  5. 다음 필드를 구성합니다.

    • 이름 - 데이터 원본 이름.

    • 설명 — 데이터 소스 설명.

  6. 데이터 소스 유형에서 Amazon Redshift를 선택합니다.

  7. 환경 선택에서 Amazon Redshift 테이블을 게시할 환경을 지정합니다.

  8. 선택한 환경에 따라 DataZone Amazon은 자동으로 Amazon Redshift 자격 증명 및 기타 매개 변수를 환경에서 직접 적용하거나 사용자가 직접 선택할 수 있는 옵션을 제공합니다.

    • 환경의 기본 Amazon Redshift 스키마에서 게시만 허용하는 환경을 선택한 경우 Amazon은 Amazon Redshift 자격 증명과 Amazon Redshift 클러스터 또는 작업 그룹 이름 AWS , 암호, 데이터베이스 이름, 스키마 이름을 비롯한 기타 파라미터를 DataZone 자동으로 적용합니다. 이렇게 자동으로 채워진 매개변수는 편집할 수 없습니다.

    • 데이터를 게시할 수 없는 환경을 선택하면 데이터 원본 생성을 계속할 수 없습니다.

    • 모든 스키마에서 데이터를 게시할 수 있는 환경을 선택하면 해당 환경의 자격 증명 및 기타 Amazon Redshift 파라미터를 사용하거나 자체 자격 증명/파라미터를 입력할 수 있는 옵션이 표시됩니다.

  9. 자체 자격 증명을 사용하여 데이터 소스를 생성하기로 선택한 경우 다음 세부 정보를 제공하십시오.

    • Amazon Redshift 자격 증명 제공에서 프로비저닝된 Amazon Redshift 클러스터를 사용할지 아니면 Amazon Redshift 서버리스 작업 공간을 데이터 소스로 사용할지를 선택합니다.

    • 위 단계에서 선택한 항목에 따라 드롭다운 메뉴에서 Amazon Redshift 클러스터 또는 작업 공간을 선택한 다음 AWS Secrets Manager에서 인증에 사용할 암호를 선택합니다. 기존 암호를 선택하거나 새 암호를 생성할 수 있습니다.

    • 기존 암호가 드롭다운에 나타나도록 하려면 AWS Secrets Manager의 암호에 다음 태그 (키/값) 가 포함되어 있어야 합니다.

      • AmazonDataZoneProject: <projectID>

      • AmazonDataZoneDomain: <domainID>

      새 암호를 만들기로 선택하면 암호에 위에서 참조한 태그가 자동으로 지정되므로 추가 단계가 필요하지 않습니다. 자세한 내용은 데이터베이스 자격 증명 저장을 참조하십시오. AWS Secrets Manager

      데이터 소스 생성을 위해 제공된 AWS 암호의 Amazon Redshift 사용자는 게시할 테이블에 대한 SELECT 권한을 가지고 있어야 합니다. Amazon이 DataZone 귀하를 대신하여 구독 (액세스) 을 관리하도록 하려면 AWS 시크릿의 데이터베이스 사용자에게도 다음과 같은 권한이 있어야 합니다.

      • CREATE DATASHARE

      • ALTER DATASHARE

      • DROP DATASHARE

  10. 데이터 선택에서 Amazon Redshift 데이터베이스, 스키마를 제공하고 테이블 또는 뷰 선택 기준을 입력합니다. 예를 들어 Include를 선택하고 *corporate Enter를 선택하면 해당 단어로 corporate 끝나는 모든 소스 테이블이 자산에 포함됩니다.

    단일 데이터베이스 내의 테이블에 대해 여러 개의 포함 규칙을 추가할 수 있습니다. 다른 데이터베이스 추가 버튼을 사용하여 여러 데이터베이스를 추가할 수도 있습니다.

  11. 다음을 선택합니다.

  12. 게시 설정의 경우 데이터 카탈로그에서 자산을 즉시 검색할 수 있는지 여부를 선택합니다. 인벤토리에만 추가하는 경우 나중에 구독 조건을 선택하여 비즈니스 데이터 카탈로그에 게시할 수 있습니다. 자세한 정보는 기존 Amazon DataZone 데이터 소스 관리을 참조하세요.

  13. 자동 비즈니스 이름 생성의 경우 원본에서 게시되고 업데이트되는 자산의 메타데이터를 자동으로 생성할지 여부를 선택합니다.

  14. (선택 사항) 메타데이터 양식의 경우, 자산을 Amazon으로 가져올 때 수집 및 저장되는 메타데이터를 정의하는 양식을 추가합니다 DataZone. 자세한 정보는 메타데이터 양식을 생성, 편집 또는 삭제합니다.을 참조하세요.

  15. 실행 환경설정에서 데이터 소스 실행 시기를 선택합니다.

    • 일정에 따라 실행 - 데이터 원본을 실행할 날짜 및 시간을 지정합니다.

    • 온디맨드 실행 - 데이터 원본 실행을 수동으로 시작할 수 있습니다.

  16. 다음을 선택합니다.

  17. 데이터 원본 구성을 검토하고 만들기를 선택합니다.

참고

Amazon Redshift 데이터 소스가 생성되면 Amazon은 데이터 소스를 생성하는 데 사용된 환경에 대한 '읽기 전용' 액세스 권한을 DataZone 부여하여 데이터 소스에서 사용되는 Amazon Redshift 스키마의 모든 테이블에 액세스할 수 있습니다. 환경의 세부 정보 페이지에서 데이터 소스에서 이러한 권한 부여 상태를 모니터링할 수 있습니다.

환경을 만드는 데 사용한 것과 다른 Amazon Redshift 클러스터 또는 서버리스 작업 그룹을 사용하는 경우 클러스터 또는 작업 그룹에 다음 AWS 태그가 추가되었는지 확인해야 합니다. 이는 환경 사용자가 Amazon Redshift 쿼리 편집기 V2에서 부여된 데이터베이스를 볼 수 있도록 하는 데 필요합니다. DataZoneDiscoverable_${domainId}: true

현재 Amazon 릴리스 이전에 생성된 환경의 경우 DataZone, 프로젝트 구성원은 Amazon Redshift에서 부여된 테이블을 볼 수 없습니다.