本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
参考架构
下图显示了本指南用于在上扩展和扩展数据湖的参考架构 AWS Cloud。

该图显示了以下组件:
-
不同的数据创建器层 AWS 账户。
-
数据使用者层与众不同 AWS 账户。
-
中的集中式目录 AWS 账户。
-
尽管每个业务领域只有一个数据创建者和一个数据使用者,但该指南的参考架构支持每个业务领域的多个数据创建者和数据使用者。通常会将一个数据创建器与一个或多个数据使用者结合起来,这些使用者包括数据服务和应用程序类型。有关这方面的更多信息,请参阅本指南的参考架构组件部分。
-
集中式目录是数据生产者和数据使用者用来共享和使用数据的接口。
参考架构的方法使标准化数据共享和使用成为可能,并在不增加管理开销的情况下独立扩展数据生成器和数据使用者。参考架构还支持在不同的数据生产者之间生成和分发数据。任何数据生产者都可以成为数据湖的一部分,共享他们的数据,并为数据湖提供的整体价值做出贡献。
这种方法使您的组织能够在整个业务线和外部数据所有者中获得数据价值,而不会因为将数据收集和处理限制在单个管道中而造成瓶颈。