Producteurs de données - AWS Directives prescriptives

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Producteurs de données

Un producteur de données collecte, traite et stocke les données de son domaine de données, en plus de surveiller et de garantir la qualité de ses actifs de données. Le schéma suivant montre le compte du producteur de données en tant que composant de l'architecture de référence de ce guide.

Le producteur de données en tant que composant de l'architecture de référence de ce guide.

Chaque producteur de données dispose d'un catalogue de données privé géré par AWS Lake Formation lui-même Compte AWS qui est utilisé par son processus de données interne. Les producteurs de données fournissent au catalogue centralisé des autorisations sélectives sur leurs données, ce qui signifie que Lake Formation peut accéder aux données que le producteur de données souhaite partager dans le compte du catalogue centralisé.

Cela signifie que les producteurs de données n'interagissent pas directement avec les consommateurs de données. Au lieu de cela, le compte du producteur de données et son emplacement de stockage des données sont complètement abstraits et masqués au consommateur de données. Cette approche réduit les coûts en supprimant les frais inutiles pour les producteurs de données confrontés à une augmentation du nombre de leurs consommateurs de données.

Une modification de l'emplacement des données du producteur de données n'a aucune incidence sur le consommateur de données si le nouvel emplacement des données est enregistré par le catalogue centralisé. Si le producteur de données souhaite arrêter de partager certaines données, il peut supprimer les autorisations du catalogue centralisé. Cela empêche les consommateurs de données d'accéder aux données et élimine le besoin de révoquer manuellement l'accès pour chaque consommateur de données.

En utilisant des catalogues de données publics et privés, les producteurs de données peuvent choisir ce qu'ils souhaitent partager avec les consommateurs de données, tout en gérant de manière indépendante l'accès aux données internes via un catalogue de données privé.

Le tableau suivant décrit les deux AWS services utilisés par les producteurs de données pour partager des données avec le catalogue centralisé.

Amazon Simple Storage Service (Amazon S3)

Ajustez la politique de compartiment pour les compartiments S3 afin de fournir un accès aux données aux rôles AWS Identity and Access Management (IAM) du catalogue centralisé.

Les producteurs de données peuvent également partager des données stockées dans d'autres applications ou services de données en utilisant Amazon S3 comme couche de données intermédiaire.

AWS Key Management Service (AWS KMS) Fournissez des autorisations pour les clés AWS gérées aux rôles IAM dans le catalogue centralisé et pour les clés AWS KMS keys utilisées pour chiffrer les données Amazon S3 partagées dans les comptes des producteurs de données.