아마존 DataZone 용어 및 개념 - 아마존 DataZone

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

아마존 DataZone 용어 및 개념

Amazon을 시작할 때는 DataZone Amazon의 주요 개념, 용어 및 구성 요소를 이해하는 것이 중요합니다.

아마존 DataZone 컴포넌트

Amazon은 다음과 같은 네 가지 주요 구성 요소를 DataZone 포함합니다.

  • 비즈니스 데이터 카탈로그 - 이 구성 요소를 사용하여 비즈니스 컨텍스트와 함께 조직 전체의 데이터를 카탈로그화하여 조직의 모든 사람이 데이터를 빠르게 찾고 이해할 수 있도록 할 수 있습니다.

  • 워크플로 게시 및 구독 - 이러한 자동화된 워크플로를 사용하여 셀프 서비스 방식으로 생산자와 소비자 간의 데이터를 보호하고 조직의 모든 사람이 올바른 목적에 맞는 올바른 데이터에 액세스할 수 있도록 할 수 있습니다.

  • 프로젝트 및 환경

    • Amazon에서 DataZone 프로젝트는 분석에 대한 액세스를 단순화하는 데 사용되는 사람, 자산 (데이터) 및 도구를 그룹화하는 비즈니스 사용 사례를 기반으로 합니다. AWS 프로젝트는 프로젝트 구성원이 협업하고, 데이터를 교환하고, 자산을 공유할 수 있는 영역을 제공합니다. 기본적으로 프로젝트는 프로젝트에 명시적으로 추가된 사용자만 프로젝트 내의 데이터 및 분석 도구에 액세스할 수 있도록 구성됩니다. 프로젝트는 데이터 소비자가 액세스할 수 있도록 프로젝트 정책에 따라 생성된 자산의 소유권을 관리합니다.

    • Amazon DataZone 프로젝트 내에서 환경은 지정된 IAM 주체 세트 (예: 기여자 권한을 가진 사용자) 가 운영할 수 있는 0개 이상의 구성된 리소스 (예: Amazon S3 버킷, AWS Glue 데이터베이스 또는 Amazon Athena 작업 그룹) 의 모음입니다.

  • 데이터 포털 ( AWS Management Console 외부) - 다양한 사용자가 셀프 서비스 방식으로 데이터를 카탈로그 작성, 검색, 관리, 공유 및 분석할 수 있는 브라우저 기반 웹 애플리케이션입니다. 데이터 포털은 IAM 자격 증명 또는 ID 공급자의 기존 자격 증명으로 사용자를 인증합니다. AWS IAM Identity Center

Amazon DataZone 도메인이란 무엇입니까?

Amazon DataZone 도메인을 사용하여 자산, 사용자 및 프로젝트를 구성할 수 있습니다. Amazon DataZone 도메인과 추가 AWS 계정을 연결하여 데이터 소스를 통합할 수 있습니다. 그런 다음 메타데이터 완전성과 품질을 개선하는 메타데이터 양식 및 용어집과 함께 이러한 데이터 소스의 자산을 도메인 카탈로그에 게시할 수 있습니다. 또한 이러한 자산을 검색 및 탐색하여 도메인에 게시된 데이터를 확인할 수 있습니다. 또한 프로젝트에 참여하여 다른 사용자와 협업하고, 자산을 구독하고, 프로젝트 환경을 사용하여 Amazon Athena 및 Amazon Redshift와 같은 분석 도구에 액세스할 수 있습니다. Amazon DataZone 도메인을 사용하면 기업용 단일 Amazon 도메인을 생성하든 사업부별로 여러 Amazon DataZone DataZone 도메인을 생성하든 관계없이 조직 구조의 데이터 및 분석 요구 사항을 유연하게 반영할 수 있습니다.

Amazon DataZone 프로젝트 및 환경이란 무엇입니까?

Amazon은 팀, 도구 및 데이터를 사용 사례별로 그룹화하여 팀과 분석 사용자가 프로젝트에서 협업할 수 DataZone 있도록 합니다.

  • Amazon에서는 프로젝트를 통해 사용자 그룹이 Amazon DataZone 카탈로그의 데이터를 게시, 검색, 구독 및 사용하는 것과 관련된 다양한 비즈니스 사용 사례에 대해 협업할 수 있습니다. DataZone 프로젝트 구성원은 Amazon DataZone 카탈로그의 자산을 사용하고 하나 이상의 분석 워크플로를 사용하여 새 자산을 생성합니다. 프로젝트는 데이터 포털 내에서 다음 활동을 지원합니다.

    • 프로젝트 소유자는 소유자 및 기여자 권한이 있는 구성원을 추가할 수 있습니다.

    • 프로젝트 구성원은 SSO 사용자, SSO 그룹, IAM 사용자일 수 있습니다.

    • 프로젝트 구성원은 데이터 카탈로그의 자산에 대한 구독을 요청할 수 있습니다.

      프로젝트에 구독 승인이 제공됩니다.

  • Amazon DataZone 프로젝트에서 환경이란 0개 이상의 구성된 리소스 (예: Amazon S3, AWS Glue 데이터베이스 또는 Amazon Athena 워크그룹) 로 구성된 모음으로, 해당 리소스를 운영할 수 있는 지정된 IAM 보안 주체 집합이 있습니다. 환경은 환경 생성을 위한 재사용 가능한 템플릿을 제공하는 사전 구성된 리소스 및 청사진 세트인 환경 프로필을 사용하여 생성됩니다. 환경 프로파일은 환경이 배포되는 지역 AWS 계정 또는 지역과 같은 설정을 정의합니다.

아마존 DataZone 블루프린트란 무엇입니까?

환경이 생성되는 블루프린트는 환경이 속한 프로젝트의 구성원이 Amazon 카탈로그의 자산을 사용할 때 사용할 수 있는 AWS 도구 및 서비스 (예: Amazon DataZone Redshift) 를 정의합니다. AWS Glue

DataZoneAmazon의 현재 릴리스에서는 다음과 같은 기본 블루프린트가 지원됩니다.

블루프린트 이름 설명 생성할 리소스
데이터 레이크 블루프린트

Amazon DataZone 프로젝트 구성원이 환경 내에서 Data Lake 생산자 및 소비자 서비스를 시작할 수 있도록 합니다.

이를 통해 Amazon DataZone 프로젝트 구성원은 Amazon Athena와 Lake Formation이 지원하는 다른 쿼리 엔진에서 Lake Formation이 관리하는 자산의 '읽기 전용' 사본에 직접 액세스할 수 있습니다.

프로듀서로서 Amazon DataZone 프로젝트 구성원은 Amazon Athena를 사용하여 새로운 LakeFormation 관리형 테이블을 생성하고 이를 Amazon 카탈로그에 게시할 수 있습니다. DataZone

Amazon Athena를 사용하여 Lake Formation 테이블을 생성하고 쿼리할 수 있는 기능을 사용자에게 제공합니다. Amazon Athena 워크그룹, '읽기 전용' Lake Formation 권한, '읽기 전용' IAM 권한이 있는 AWS Glue 데이터베이스, 프로젝트에서 관리하는 Amazon S3에 대한 액세스 권한이 있는 데이터베이스 AWS Glue Lake Formation 권한 '생성' 및 '부여' 권한, '읽기' 및 '쓰기' IAM 권한, 태깅이 포함된 AWS Glue ETL (추출, 변환 및 로드) 이 있는 데이터베이스
데이터 웨어하우스 청사진

소비자는 이 청사진을 통해 Amazon DataZone 프로젝트 구성원이 자체 Amazon Redshift 클러스터에 연결하여 원격 데이터 스토어를 쿼리하고 새 데이터 세트를 생성 및 저장할 수 있습니다.

생산자는 이 청사진을 통해 Amazon DataZone 프로젝트 구성원이 자신의 Amazon Redshift 클러스터에 연결하여 원격 데이터 스토어를 쿼리하고, 새 데이터 세트를 생성하고, Amazon 카탈로그에 게시할 수 있습니다. DataZone

Amazon Redshift 쿼리 편집기에 대한 액세스, Amazon DataZone 카탈로그에서 구독한 데이터 소스에 대한 '읽기' 액세스, 구성된 Amazon Redshift 클러스터에서 로컬 자산을 생성하는 기능. Amazon Redshift 쿼리 편집기에 액세스하고, Amazon DataZone 카탈로그에서 구독한 데이터 소스에 대한 '읽기' 액세스, 구성된 Amazon Redshift 클러스터에서 자산을 생성하고 게시할 수 있습니다.
아마존 세이지메이커 청사진

이 청사진은 데이터 생산자와 소비자가 Amazon으로 원활하게 전환하여 기계 학습 (ML) 프로젝트에서 SageMaker 협업하는 동시에 데이터 및 ML 자산에 대한 액세스 거버넌스를 적용할 수 있도록 도와줍니다. DataZone Amazon과 Amazon SageMaker 간의 새로운 통합 기능을 통해 데이터 소비자와 생산자는 인프라 설정 전반에서 ML 거버넌스를 간소화하고, 비즈니스 이니셔티브에 대해 협업하고, 데이터와 ML 자산을 쉽게 관리할 수 있습니다.

Amazon에서 데이터 및 ML 자산을 검색, 구독 및 게시할 수 있는 Amazon SageMaker 도메인을 생성할 수 DataZone 있습니다. 또한 구성된 대로 AWS Glue 데이터베이스 및 Lake Formation을 구독하고 게시할 수 있습니다.

Amazon DataZone 인벤토리 및 게시 워크플로란 무엇입니까?

프로젝트 인벤토리 자산 생성

DataZone Amazon을 사용하여 데이터를 카탈로그화하려면 먼저 데이터 (자산) 를 프로젝트 인벤토리로 Amazon에 가져와야 DataZone 합니다. 프로젝트용 인벤토리를 생성하면 해당 프로젝트 구성원만 자산을 검색할 수 있습니다. 명시적으로 게시되지 않는 한 모든 도메인 사용자가 검색/찾아보기에서 프로젝트 인벤토리 자산을 사용할 수 있는 것은 아닙니다. DataZoneAmazon의 현재 릴리스에서는 다음과 같은 방법으로 프로젝트 인벤토리에 자산을 추가할 수 있습니다.

  • 데이터 포털을 통해 또는 Amazon DataZone API를 사용하여 데이터 소스를 생성하고 실행합니다. Amazon의 현재 릴리스에서는 AWS Glue 및 Amazon DataZone Redshift용 데이터 소스를 생성하고 실행할 수 있습니다. AWS Glue 또는 Amazon Redshift 데이터 소스를 생성 및 실행하면 선택한 프로젝트 인벤토리에 자산을 생성하고 소스 데이터베이스 테이블 또는 데이터 웨어하우스에서 해당 기술 메타데이터를 인벤토리로 Amazon으로 가져올 수 있습니다. DataZone

  • API를 사용하면 사용 가능한 시스템 자산 유형 (AWS Glue, Amazon Redshift, Amazon S3 객체) 또는 사용자 지정 자산 유형에서 자산을 생성할 수 있습니다.

    • Amazon DataZone API를 사용하여 프로젝트 인벤토리에 사용자 지정 자산 유형을 생성합니다. 사용자 지정 자산 유형에는 ML 모델, 대시보드, 온프레미스 테이블 등이 포함될 수 있습니다.

    • Amazon DataZone API를 사용하여 이러한 사용자 지정 자산 유형에서 자산을 생성합니다.

  • Amazon DataZone 데이터 포털을 사용하여 S3 객체의 자산을 수동으로 생성합니다.

프로젝트 인벤토리 자산 큐레이션 - 프로젝트 인벤토리를 생성한 후 데이터 소유자는 비즈니스 이름 (자산 및 스키마), 설명 (자산 및 스키마), Read Me, 용어집 용어 (자산 및 스키마), 메타데이터 양식을 추가하거나 업데이트하여 필요한 비즈니스 메타데이터로 인벤토리 자산을 관리할 수 있습니다. 데이터 포털이나 Amazon DataZone API를 사용하여 이 작업을 수행할 수 있습니다. 자산을 편집할 때마다 새 인벤토리 버전이 생성됩니다.

Amazon DataZone 카탈로그에 프로젝트 인벤토리 자산 게시

Amazon을 사용하여 데이터를 DataZone 카탈로그화하는 다음 단계는 프로젝트의 인벤토리 자산을 도메인 사용자가 검색할 수 있도록 하는 것입니다. 아마존 DataZone 카탈로그에 인벤토리 자산을 게시하여 이 작업을 수행할 수 있습니다. 인벤토리 자산의 최신 버전만 카탈로그에 게시할 수 있으며 가장 최근에 게시된 버전만 검색 카탈로그에서 활성화됩니다. 재고 자산이 아마존 DataZone 카탈로그에 게시된 후 업데이트되는 경우, 검색 카탈로그에 최신 버전이 포함되도록 하려면 이를 다시 명시적으로 게시해야 합니다. DataZoneAmazon의 현재 릴리스에서는 다음과 같은 방법으로 프로젝트 인벤토리 자산을 Amazon DataZone 카탈로그에 게시할 수 있습니다.

  • 데이터 포털을 통해 또는 Amazon DataZone API를 사용하여 프로젝트 인벤토리 자산을 Amazon DataZone 카탈로그에 수동으로 게시하십시오.

  • 데이터 소스를 생성 또는 편집하는 과정에서 옵션으로 AWS Glue 자산을 카탈로그에 게시 또는 Amazon Redshift 자산을 카탈로그 설정에 게시하여 예약 또는 자동 데이터 소스 실행 중에 사용할 수 있도록 활성화하십시오. 이 설정을 활성화하면 데이터 소스 실행이 프로젝트 인벤토리에 자산을 추가한 다음 인벤토리 자산을 Amazon DataZone 카탈로그에 게시합니다. 직접 게시하는 경우 자산에 비즈니스 메타데이터가 없을 수 있으며 모든 도메인 사용자가 직접 검색할 수 있게 됩니다. 이 설정은 데이터 포털을 통해 또는 Amazon DataZone API를 사용하여 데이터 소스에서 사용할 수 있습니다.

Amazon DataZone 구독 및 주문 처리 워크플로란 무엇입니까?

자산이 Amazon DataZone 카탈로그에 게시되면 도메인 사용자는 이러한 자산을 검색하고, 해당 자산에 대한 액세스를 요청 및 획득하고, DataZone Amazon을 계속 사용하여 이러한 자산을 관리, 공유 및 분석할 수 있습니다.

사용자는 프로젝트를 대신하여 해당 자산을 구독하여 자산에 대한 액세스를 요청합니다. 구독 요청이 생성되면 자산 소유자가 알림을 받고 구독 요청을 검토하고 승인 또는 거부 여부를 결정할 수 있습니다. 데이터 소유자가 구독 요청을 승인하면 구독 프로젝트에 해당 자산에 대한 액세스 권한이 부여됩니다.

구독 요청이 승인되면 Amazon은 AWS Lake Formation 또는 Amazon Redshift에서 필요한 지원금을 생성하여 프로젝트 내 모든 해당 환경에 자산을 자동으로 추가하는 구독 처리 워크플로를 DataZone 시작합니다. 이를 통해 구독하는 프로젝트 구성원은 자신의 환경에서 쿼리 도구 (Amazon Athena 또는 Amazon Redshift 쿼리 편집기) 중 하나를 사용하여 자산을 쿼리할 수 있습니다.

Amazon은 관리 자산 ( AWS Glue 테이블 및 Amazon Redshift 테이블 및 보기 포함) 에 대해서만 이 자동 주문 처리 로직을 트리거할 DataZone 수 있습니다. 다른 모든 자산 유형 (비관리 자산) 의 경우 Amazon은 자동으로 주문 처리를 DataZone 트리거할 수 없으며 대신 필요한 모든 세부 정보를 이벤트 페이로드에 포함하여 Amazon Eventbridge에 이벤트를 게시하므로 Amazon 외부에서 필요한 보조금을 생성할 수 있습니다. DataZone DataZone 또한 Amazon은 Amazon 외부에서 구독이 완료되면 구독 상태를 업데이트할 DataZone 수 있는 updateSubscriptionStatus API를 DataZone 제공하므로 Amazon은 프로젝트 구성원에게 자산 사용을 시작할 수 있음을 알릴 수 있습니다.

Amazon의 사용자 페르소나 DataZone

다음은 기본 Amazon DataZone 사용자 페르소나입니다.

  • Amazon을 조직의 분석 DataZone 플랫폼으로 설정한 도메인 관리자

    Amazon의 DataZone 경우 도메인 관리자는 AWS 계정에 DataZone Amazon을 설치하고, Amazon DataZone 도메인을 생성하고, Amazon DataZone 도메인과의 AWS 계정 연결 및 ID 공급자 연결을 구성합니다. 또한 도메인 관리자는 AWS 조직 및 AWS 서비스 카탈로그와 같은 다른 서비스 콘솔을 사용하여 Amazon을 구성합니다. DataZone

  • 분석 및 기계 학습 작업을 수행하는 Amazon의 주 사용자 DataZone (자산 게시자 및 구독자) 인 데이터 사용자

    데이터 사용자에는 데이터 자산을 생산하고 소비하는 데이터 분석 작업자, 데이터 과학자, 시스템 사용자가 포함됩니다. Amazon의 DataZone 경우 데이터 사용자는 프로젝트 및 환경을 생성 및 가입하고, 사전 구성된 분석 또는 기계 학습 도구를 사용하여 데이터 자산을 구독 및 사용하고, 출력 데이터 자산을 Amazon DataZone 도메인 카탈로그에 다시 게시하여 다른 사람과 공유합니다.

  • 사용자 지정 인프라 템플릿을 구축하고 DataZone Amazon을 내부 카탈로그 또는 프로덕션 시스템과 통합하는 시스템 개발자

    Amazon의 관점에서 보면 시스템 개발자는 환경 공급자로서 환경 청사진 (인프라 템플릿) 또는 Infrastructure-As-Code CI/CD 파이프라인을 구축하고 DataZone, 환경 전반에서 데이터 자산을 홍보하기 위한 데이터 파이프라인, 내부 카탈로그와 통합하기 위한 카탈로그 동기화 및 구독 승인 처리 어댑터, 또는 필요한 경우 Amazon API와 내부 사용자 인터페이스 또는 프로덕션 시스템 간의 통합을 구축합니다. DataZone

  • 조직 보안, 개인 정보 보호 및 기타 규정 준수 정책의 정의와 위험을 소유하고 조직에서 DataZone Amazon을 사용할 때 이러한 정의를 준수하는지 확인하는 데이터 거버넌스 책임자.

아마존 DataZone 용어

도메인

Amazon DataZone 도메인은 자산, 사용자 및 프로젝트를 함께 연결하는 조직 주체입니다. Amazon DataZone 도메인을 사용하면 기업을 위한 단일 Amazon 도메인을 생성하든, 여러 데이터 영역을 생성하든, 다른 사업부 또는 팀을 위한 DataZone 도메인을 생성하든 관계없이 조직 구조의 데이터 및 분석 요구 사항을 유연하게 반영할 수 있습니다.

관련 계정

AWS 계정을 Amazon DataZone 도메인과 연결하면 이러한 AWS 계정의 데이터를 Amazon DataZone 카탈로그에 게시하고 Amazon DataZone 프로젝트를 생성하여 여러 AWS 계정의 데이터를 사용할 수 있습니다. 계정 연결 요청은 Amazon DataZone 도메인을 소유한 AWS 계정에서만 시작할 수 있습니다. 계정 연결 요청은 초대된 AWS 계정의 관리자만 수락할 수 있습니다. AWS 계정이 Amazon DataZone 도메인과 연결되면 이 계정의 AWS Glue 카탈로그 및 Amazon Redshift와 같은 데이터 소스를 이 도메인에 등록할 수 있습니다. 또한 AWS 계정을 연결하면 Amazon DataZone 프로젝트 및 환경을 만들 수 있습니다.

는 하나 이상의 Amazon DataZone 도메인과 연결할 AWS 계정 수 있습니다.

데이터 소스

DataZoneAmazon에서는 데이터 소스를 사용하여 원본 데이터베이스 또는 데이터 웨어하우스에서 자산 (데이터) 의 기술 메타데이터를 DataZone Amazon으로 가져올 수 있습니다. Amazon의 현재 릴리스에서는 AWS Glue 및 Amazon DataZone Redshift용 데이터 소스를 생성하고 실행할 수 있습니다. 데이터 소스를 생성하면 DataZone Amazon과 소스 (AWS Glue Data Catalog 또는 Amazon Redshift Warehouse) 간에 연결을 설정하여 테이블 이름, 열 이름, 데이터 유형을 비롯한 기술 메타데이터를 읽을 수 있습니다. 데이터 소스를 생성하면 DataZone Amazon에서 새 자산을 생성하거나 기존 자산을 업데이트하는 초기 데이터 소스 실행도 시작할 수 있습니다. 데이터 소스를 생성하는 동안 또는 데이터 소스를 성공적으로 생성한 후에 데이터 소스 실행 일정을 지정할 수도 있습니다.

데이터 원본 실행

DataZoneAmazon에서 데이터 소스 실행은 프로젝트 인벤토리에 자산을 생성하고 선택적으로 프로젝트 인벤토리 자산을 Amazon DataZone 카탈로그에 게시하기 위해 Amazon이 DataZone 수행하는 작업입니다. 데이터 소스 실행을 자동화 (데이터 소스 최초 생성 시 시작) 하거나 예약 또는 수동으로 실행할 수 있습니다. 데이터 선택 기준을 사용하면 프로젝트 인벤토리 또는 Amazon DataZone 카탈로그에 수집할 기존 및 미래 데이터 세트와 해당 인벤토리 또는 카탈로그 자산에 대한 메타데이터 업데이트 빈도를 세밀하게 조정할 수 있습니다.

구독 목표

DataZoneAmazon에서는 구독 대상을 통해 프로젝트에서 구독한 데이터에 액세스할 수 있습니다. 구독 대상은 Amazon DataZone 프로젝트 구성원이 구독한 데이터에 대한 쿼리를 시작할 수 있도록 Amazon이 원본 데이터와의 연결을 설정하고 필요한 권한을 생성하는 데 사용할 DataZone 수 있는 위치 (예: 데이터베이스 또는 스키마) 와 필요한 권한 (예: IAM 역할) 을 지정합니다.

구독 요청

DataZoneAmazon에서 구독 요청은 특정 자산에 대한 액세스 권한을 부여받기 위해 Amazon DataZone 프로젝트가 따라야 하는 프로세스입니다. 구독 요청은 승인, 거부, 취소 또는 승인될 수 있습니다.

자산

Amazon에서 자산은 단일 물리적 데이터 객체 (예: 테이블 DataZone, 대시보드, 파일) 또는 가상 데이터 객체 (예: 뷰) 를 제공하는 엔티티입니다.

애셋 유형

자산 유형은 자산이 Amazon DataZone 카탈로그에 표시되는 방식을 정의합니다. 자산 유형은 특정 유형의 자산에 대한 스키마를 정의합니다. 자산이 생성되면 자산 유형 (기본적으로 최신 버전) 에 정의된 스키마를 기준으로 자산의 유효성이 검사됩니다. 자산 업데이트가 발생하면 Amazon은 새 자산 버전을 DataZone 생성하여 Amazon DataZone 사용자가 모든 자산 버전을 운영할 수 있도록 합니다.

비즈니스 용어집

DataZoneAmazon에서 비즈니스 용어집은 자산과 연관될 수 있는 비즈니스 용어 모음입니다. 비즈니스 용어집은 조직의 다양한 데이터 분석 작업 전반에 걸쳐 동일한 용어와 정의를 사용하는 데 도움이 됩니다.

비즈니스 용어집의 용어를 자산 및 열에 추가하여 검색 중에 해당 속성을 분류하거나 식별성을 높일 수 있습니다. 자산과 연결된 메타데이터 양식에서 필드의 값 유형으로 용어집을 선택할 수 있습니다. 자산의 메타데이터 양식 필드 값으로 특정 용어를 선택하면 사용자는 비즈니스 용어집 용어를 검색하고 관련 자산을 찾을 수 있습니다.

메타데이터 양식 유형

메타데이터 양식 유형은 자산이 인벤토리로 생성되거나 Amazon DataZone 도메인에 게시될 때 수집 및 저장되는 메타데이터를 정의하는 템플릿입니다. 메타데이터 양식 유형을 데이터 자산과 연결할 수 있습니다. 메타데이터 양식 유형은 도메인 관리자가 규정 준수 정보, 규정 정보 또는 분류와 같은 해당 도메인에 필요한 메타데이터 양식을 정의하는 데 도움이 됩니다. 도메인 관리자는 이를 통해 자산에 대한 추가 메타데이터를 사용자 지정할 수 있습니다. DataZone Amazon에는 asset-common-details-form -type,,,,, column-business-metadata-form s3- object-collection-form-type subscription-terms-form-type, 및 glue-table-form-type 와 같은 시스템 메타데이터 양식 유형이 있습니다. glue-view-form-type redshift-table-form-type redshift-view-form-type suggestion-form-type

메타데이터 양식

DataZoneAmazon에서 메타데이터 양식은 자산을 인벤토리로 생성하거나 Amazon DataZone 도메인에 게시할 때 수집 및 저장되는 메타데이터를 정의합니다. 메타데이터 양식 정의는 도메인 관리자가 카탈로그 도메인에서 생성합니다. 메타데이터 양식 정의는 부울, 날짜, 십진수, 정수, 문자열 및 비즈니스 용어집 필드 값 데이터 유형을 지원하는 하나 이상의 필드 정의로 구성됩니다.

도메인 관리자는 도메인에 메타데이터 양식을 추가하여 해당 도메인의 자산에 메타데이터 양식을 적용합니다. 그런 다음 에셋 퍼블리셔는 메타데이터 양식에 선택 및 필수 필드 값을 제공합니다.

프로젝트

Amazon에서는 사용자 그룹이 프로젝트를 통해 프로젝트 인벤토리에 자산을 생성하여 모든 프로젝트 구성원이 자산을 검색할 수 있도록 한 다음 Amazon 카탈로그에 자산을 게시 DataZone, 검색, 구독 및 소비하는 등 다양한 비즈니스 사용 사례에 대해 협업할 수 있습니다. DataZone 프로젝트 구성원은 Amazon DataZone 카탈로그의 자산을 사용하고 하나 이상의 분석 워크플로를 사용하여 새 자산을 생성합니다. 프로젝트 구성원은 소유자 또는 기여자일 수 있습니다. 프로젝트 소유자는 다른 사용자를 소유자 또는 기여자로 추가하거나 제거할 수 있으며 프로젝트를 수정하거나 삭제할 수 있습니다. 기여자에 대한 기타 제한은 정책으로 정의할 수 있습니다. 사용자가 프로젝트를 만들면 해당 프로젝트의 첫 번째 소유자가 됩니다.

환경

환경은 구성된 리소스 (예: Amazon S3 버킷, AWS Glue 데이터베이스 또는 Amazon Athena 작업 그룹) 의 모음으로, 해당 리소스를 운영할 수 있는 지정된 IAM 보안 주체 세트 (기여자 권한이 할당됨) 가 있습니다. 또한 각 환경에는 리소스에 액세스하고 구독 및 주문 처리를 통해 데이터에 액세스할 권한이 있는 사용자 주체가 있을 수 있습니다. 환경은 AWS 서비스와 외부 IDE 및 콘솔에 대한 실행 가능한 링크를 저장하도록 설계되었습니다. 프로젝트 구성원은 환경 내에 구성된 딥 링크를 통해 Amazon Athena 콘솔 등과 같은 서비스에 액세스할 수 있습니다. 프로젝트의 SSO 사용자 및 IAM 사용자는 특정 환경을 사용하거나 액세스할 수 있도록 범위를 더 좁힐 수 있습니다.

환경 프로필

DataZoneAmazon에서 환경 프로파일은 환경을 생성하는 데 사용할 수 있는 템플릿입니다. 환경 프로파일은 블루프린트를 사용하여 생성됩니다.

환경 프로필을 사용하면 도메인 관리자가 사전 구성된 매개 변수로 청사진을 래핑한 다음 데이터 작업자는 기존 환경 프로필을 선택하고 새 환경의 이름을 지정하여 새 환경을 원하는 수만큼 빠르게 만들 수 있습니다. 이를 통해 데이터 작업자는 도메인 관리자가 시행하는 데이터 거버넌스 정책을 준수하면서 프로젝트와 환경을 효율적으로 관리할 수 있습니다.

청사진

환경이 생성되는 블루프린트는 환경이 속한 프로젝트의 구성원이 Amazon 카탈로그의 자산을 사용할 때 사용할 수 있는 AWS 도구 및 서비스 (예: Amazon DataZone Redshift) 를 정의합니다. AWS Glue

DataZone Amazon의 현재 릴리스에서는 다음과 같은 기본 블루프린트가 지원됩니다.

  • 데이터 레이크 블루프린트

  • 데이터 웨어하우스 청사진

  • 아마존 세이지메이커 청사진

사용자 프로필

사용자 프로필은 Amazon DataZone 사용자를 나타냅니다. Amazon은 다양한 목적으로 Amazon DataZone 관리 콘솔 및 데이터 포털과 상호 작용할 수 있도록 IAM 역할과 SSO ID를 모두 DataZone 지원합니다. 도메인 관리자는 IAM 역할을 사용하여 Amazon DataZone Management Console에서 새 Amazon 도메인 생성, 메타데이터 양식 유형 구성, 정책 구현 등 DataZone 도메인 관련 초기 관리 작업을 수행합니다. 데이터 작업자는 Identity Center를 통해 SSO 기업 ID를 사용하여 Amazon DataZone Data Portal에 로그인하고 멤버십이 있는 프로젝트에 액세스합니다.

그룹 프로필

그룹 프로필은 Amazon DataZone 사용자 그룹을 나타냅니다. 그룹을 수동으로 만들거나 기업 고객의 Active Directory 그룹에 매핑할 수 있습니다. DataZoneAmazon에서 그룹은 두 가지 용도로 사용됩니다. 첫째, 그룹을 조직도의 사용자 팀에 매핑할 수 있으므로 팀에 새로 합류하거나 퇴사하는 직원이 있을 때 Amazon DataZone 프로젝트 소유자의 관리 업무를 줄일 수 있습니다. 둘째, 기업 관리자는 Active Directory 그룹을 사용하여 사용자 상태를 관리하고 업데이트하므로 Amazon DataZone 도메인 관리자는 이러한 그룹 멤버십을 사용하여 Amazon DataZone 도메인 정책을 구현할 수 있습니다.

도메인 관리자

DataZoneAmazon에서는 Amazon 도메인을 생성하는 IAM 보안 주체가 해당 DataZone 도메인의 기본 도메인 관리자입니다. Amazon의 도메인 관리자는 도메인 생성, 다른 도메인 관리자 할당, 데이터 소스 및 구독 대상 추가, 프로젝트 및 환경 생성, 프로젝트 소유자 할당 등 도메인의 주요 기능을 DataZone 수행합니다.

퍼블리셔

DataZoneAmazon에서는 게시자가 자산을 Amazon DataZone 카탈로그에 게시하고 게시한 자산의 메타데이터를 편집할 수 있습니다. 이 권한이 부여되면 게시자는 아마존 카탈로그에 게시한 자산에 대한 구독 요청을 승인하거나 거부할 수 있습니다. DataZone

구독자

DataZoneAmazon에서 구독자는 Amazon 카탈로그에서 자산을 찾고, 액세스하고, 사용하려는 Amazon DataZone DataZone 프로젝트입니다.

AWS 계정 owner

DataZoneAmazon에서는 AWS 계정 소유자가 자신의 역할, 정책 및 권한을 생성하여 Amazon DataZone 도메인과 AWS 계정 연결할 수 AWS 계정 있도록 합니다.