資料生產者 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

資料生產者

除了監控和確保資料資產的品質之外,資料生產者還會從其資料網域收集、處理和存放資料。下圖顯示資料生產者帳戶做為本指南參考架構的元件。

做為本指南參考架構元件的資料生產者。

每個資料生產者都有由 在其 AWS 帳戶 AWS Lake Formation 中管理的私有 Data Catalog,供其內部資料程序使用。資料生產者為集中式目錄提供其資料的選擇性許可,這表示集中式目錄帳戶中的 Lake Formation 可以存取資料生產者想要共用的資料。

這表示資料生產者不會直接與資料消費者互動。相反地,資料生產者帳戶及其資料儲存位置會完全抽象化,並從資料取用者中隱藏。這種方法透過消除資料生產者在資料消費者增加時不必要的額外負荷來降低成本。

如果新的資料位置是由集中式目錄註冊,則變更資料生產者的資料位置不會影響資料取用者。如果資料生產者想要停止共用特定資料,他們可以移除集中式目錄的許可。這可防止資料取用者存取資料,並免除為每個資料取用者手動撤銷存取權的需求。

透過使用公有和私有資料目錄,資料生產者可以選擇要與資料消費者共用的內容,同時透過私有資料目錄獨立管理內部資料存取。

下表說明資料生產者用來與集中式目錄共用資料的兩項 AWS 服務。

Amazon Simple Storage Service (Amazon S3)

調整 S3 儲存貯體的儲存貯體政策,以提供集中式目錄中 AWS Identity and Access Management (IAM) 角色的資料存取。

資料生產者也可以使用 Amazon S3 做為中繼資料層,共用存放在其他資料應用程式或服務中的資料。

AWS Key Management Service (AWS KMS) 將 AWS 受管金鑰的許可提供給集中式目錄中的 IAM 角色,以及 AWS KMS keys 用於加密資料生產者帳戶中共用 Amazon S3 資料的 。