数据生产者 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

数据生产者

数据生产者除了监控和确保其数据资产的质量外,还会收集、处理和存储其数据域中的数据。下图显示了作为本指南参考架构组成部分的数据生产者帐户。

数据生成器是本指南参考架构的组成部分。

每个数据创建者都有一个由管理 AWS Lake Formation 的私有数据目录 AWS 账户 ,供其内部数据处理使用。数据生成者为集中式目录提供对其数据的选择性权限,这意味着集中式目录账户中的 Lake Formation 可以访问数据创建者想要共享的数据。

这意味着数据生产者不直接与数据使用者互动。相反,数据生产者帐户及其数据存储位置是完全抽象的,对数据使用者是隐藏的。这种方法通过消除数据使用者增加的数据生产者不必要的开销来降低成本。

如果新的数据位置是由集中式目录注册的,则更改数据创建者的数据位置不会影响数据使用者。如果数据创建者想要停止共享特定数据,他们可以移除集中式目录的权限。这样可以防止数据使用者访问数据,也无需手动撤消每个数据使用者的访问权限。

通过使用公共和私有数据目录,数据生产者可以选择与数据使用者共享的内容,同时通过私有数据目录独立管理内部数据访问权限。

下表描述了数据创建者用来与集中式目录共享数据的两种 AWS 服务。

Amazon Simple Storage Service(Amazon S3)

调整 S3 存储桶的存储桶策略,为集中式目录中的 AWS Identity and Access Management (IAM) 角色提供数据访问权限。

数据创建者还可以使用 Amazon S3 作为中间数据层,共享存储在其他数据应用程序或服务中的数据。

AWS Key Management Service (AWS KMS) 为集中式目录中的 IAM 角色提供 AWS 托管密钥的权限,以及 AWS KMS keys 用于加密数据创建者账户中共享的 Amazon S3 数据的权限。