As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Arquitetura de referência
O diagrama a seguir mostra a arquitetura de referência deste guia para o crescimento e a escalabilidade de um data lake no Nuvem AWS.

O diagrama mostra os seguintes componentes:
-
Uma camada de produção de dados diferente Contas da AWS.
-
Uma camada de consumo de dados diferente Contas da AWS.
-
Um catálogo centralizado em um Conta da AWS.
-
Embora cada linha de negócios tenha apenas um produtor e um consumidor de dados, a arquitetura de referência do guia oferece suporte a vários produtores e consumidores de dados para cada linha de negócios. É comum integrar um produtor de dados a um ou vários consumidores de dados que incluam os tipos de servidor de dados e de aplicativos. Para obter mais informações sobre isso, consulte a Componentes da arquitetura de referência seção deste guia.
-
O catálogo centralizado é a interface usada pelos produtores e consumidores de dados para compartilhar e consumir dados.
A abordagem da arquitetura de referência possibilita padronizar o compartilhamento e o consumo de dados e escalar de forma independente produtores e consumidores de dados sem aumentar sua sobrecarga de gerenciamento. A arquitetura de referência também permite a produção e distribuição de dados entre diferentes produtores de dados. Qualquer produtor de dados pode fazer parte do data lake, compartilhar seus dados e contribuir com o valor geral fornecido pelo data lake.
Essa abordagem permite que sua organização colete valor de dados em todas as suas linhas de negócios e proprietários de dados externos, sem causar gargalos ao restringir a coleta e o processamento de dados em um único pipeline.