Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Arquitectura de referencia
El siguiente diagrama muestra la arquitectura de referencia de esta guía para hacer crecer y escalar un lago de datos en Nube de AWS.

El diagrama muestra los siguientes componentes:
-
Una capa productora de datos es diferente Cuentas de AWS.
-
Una capa de consumidores de datos es diferente Cuentas de AWS.
-
Un catálogo centralizado en un Cuenta de AWS.
-
Si bien cada línea de negocio solo tiene un productor de datos y un consumidor de datos, la arquitectura de referencia de la guía admite varios productores y consumidores de datos para cada línea de negocio. Lo habitual es incorporar a un productor de datos a uno o varios consumidores de datos que incluyen tanto el tipo de servidor de datos como el de aplicaciones. Para obtener más información al respecto, consulte la Componentes de la arquitectura de referencia sección de esta guía.
-
El catálogo centralizado es la interfaz que utilizan los productores y consumidores de datos para compartir y consumir datos.
El enfoque de la arquitectura de referencia permite estandarizar el intercambio y el consumo de datos y escalar de forma independiente los productores y consumidores de datos sin aumentar la sobrecarga de administración. La arquitectura de referencia también permite la producción y distribución de datos entre diferentes productores de datos. Cualquier productor de datos puede formar parte del lago de datos, compartir sus datos y contribuir al valor general que proporciona el lago de datos.
Este enfoque permite a su organización recopilar el valor de los datos en todas sus líneas de negocio y en los propietarios de datos externos, sin provocar un cuello de botella al limitar la recopilación y el procesamiento de datos en una sola canalización.