Productores de datos - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Productores de datos

Un productor de datos recopila, procesa y almacena datos de su dominio de datos, además de monitorear y garantizar la calidad de sus activos de datos. El siguiente diagrama muestra la cuenta del productor de datos como un componente de la arquitectura de referencia de esta guía.

El productor de datos como componente de la arquitectura de referencia de esta guía.

Cada productor de datos tiene un catálogo de datos privado AWS Lake Formation gestionado por él y Cuenta de AWS que es utilizado por su proceso de datos interno. Los productores de datos proporcionan al catálogo centralizado permisos selectivos para sus datos, lo que significa que Lake Formation, en la cuenta del catálogo centralizado, puede acceder a los datos que el productor de datos desee compartir.

Esto significa que los productores de datos no interactúan directamente con los consumidores de datos. En cambio, la cuenta del productor de datos y su ubicación de almacenamiento de datos están completamente abstraídas y ocultas para el consumidor de datos. Este enfoque reduce los costos al eliminar los gastos innecesarios para los productores de datos, que experimentan un aumento en el número de consumidores de datos.

Un cambio en la ubicación de los datos del productor de datos no afecta al consumidor de datos si la nueva ubicación de datos se registra en el catálogo centralizado. Si el productor de datos quiere dejar de compartir un dato concreto, puede eliminar los permisos del catálogo centralizado. Esto evita que los consumidores de datos accedan a los datos y elimina la necesidad de revocar manualmente el acceso de cada consumidor de datos.

Al utilizar catálogos de datos públicos y privados, los productores de datos pueden elegir qué compartir con los consumidores de datos y, al mismo tiempo, gestionar de forma independiente el acceso interno a los datos a través de un catálogo de datos privado.

En la siguiente tabla se describen los dos AWS servicios que utilizan los productores de datos para compartir datos con el catálogo centralizado.

Amazon Simple Storage Service (Amazon S3)

Ajuste la política de compartimentos para los buckets de S3 para proporcionar acceso a los datos a las funciones AWS Identity and Access Management (de IAM) del catálogo centralizado.

Los productores de datos también pueden compartir los datos almacenados en otras aplicaciones o servicios de datos mediante Amazon S3 como capa de datos intermedia.

AWS Key Management Service (AWS KMS) Proporcione permisos para las claves AWS administradas de las funciones de IAM en el catálogo centralizado y las AWS KMS keys utilizadas para cifrar los datos compartidos de Amazon S3 en las cuentas de los productores de datos.