Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Intégration et octroi d'accès
L'architecture de référence des lacs de données de ce guide vous aide à dimensionner de manière indépendante les producteurs et les consommateurs de données, en plus de définir et d'établir un processus cohérent d'intégration et d'octroi d'accès à ces consommateurs de données.
Les sections suivantes décrivent le processus d'intégration des producteurs de données et des consommateurs de données, ainsi que la procédure à suivre pour accorder l'accès à un compte de consommateur de données. Ce guide utilise la méthode des ressources nommées entre le catalogue centralisé et les consommateurs de données. Le processus de la méthode LF-TBAC est similaire mais légèrement différent. Nous vous recommandons d'évaluer et de configurer ces approches pour qu'elles soient conformes aux pratiques et politiques de gouvernance des données de votre organisation.
Pour plus d'informations sur ces deux méthodes, consultez la Catalogue centralisé section de ce guide.
Intégration des producteurs de données
Le schéma suivant montre comment intégrer un nouveau producteur de données à votre lac de données.

Le schéma montre le processus d'intégration suivant :
-
Le producteur de données fournit au catalogue centralisé un accès sélectif à ses données (par exemple, un bucket AWS KMS key Amazon Simple Storage Service (Amazon S3) et). L'accès est fourni aux responsables du catalogue centralisé AWS Identity and Access Management (IAM) pour enregistrer l'emplacement du lac de données du producteur de données AWS Lake Formation et les principaux IAM utilisés pour gérer le catalogue du producteur de données.
-
Enregistrez l'emplacement du lac de données du producteur de données (par exemple, un compartiment S3) qui utilise le Lake Formation du catalogue centralisé.
-
Créez la base de données, les tables et les schémas de table pour les nouvelles données provenant du producteur de données dans le catalogue de AWS Glue données.
Intégration des consommateurs de données
Le schéma suivant montre comment intégrer un nouveau consommateur de données à votre lac de données.

Le schéma montre le processus d'intégration suivant :
-
Le consommateur de données demande l'autorisation de consulter les données du producteur de données et précise les données auxquelles il doit accéder.
-
Le responsable des données du producteur de données examine la demande du consommateur de données et évalue s'il convient de :
-
Partagez certaines ou toutes les tables des bases de données demandées. Nous recommandons le partage au niveau de la base de données lorsque le partage de toutes les tables avec le consommateur de données n'a aucune incidence sur la sécurité des données, ce qui permet d'éviter les frais de gestion liés au partage au niveau des tables.
-
Partagez au niveau de l'organisation, de l'unité d'organisation ou du compte du consommateur de données.
-
-
Une fois approuvées par le producteur de données, les ressources de catalogue de données requises sont partagées avec le consommateur de données dans le catalogue centralisé.
-
Les liens vers les ressources peuvent être créés dans le compte du consommateur de données à l'aide de Lake Formation, puis pointer vers les ressources partagées du catalogue de données dans le catalogue centralisé.
Une fois le processus d'intégration terminé, l'administrateur Lake Formation du consommateur de données peut voir la ressource du catalogue de base de données à partir du catalogue centralisé et du lien vers la ressource. À ce stade, personne d'autre dans le compte du consommateur de données ne peut accéder aux données du producteur de données.
Accorder à Select l'accès à un compte de consommateur de données
Le schéma suivant montre le processus d'octroi de l'Select
accès aux ressources de données partagées avec un principal IAM local dans le compte du consommateur de données. Le principal IAM local peut être le rôle IAM pour des utilisateurs individuels ou un rôle IAM utilisé par des services spécifiques. AWS
Note
Lorsque les données partagées sont peu sensibles, vous pouvez déléguer l'accès au consommateur de données lui-même sans avoir besoin de l'approbation du producteur de données. En effet, la confiance et le partage sont déjà établis entre eux.

Le schéma montre le processus suivant :
-
Le principal IAM individuel du compte de consommateur de données demande l'
Select
accès au lien de ressource auprès du principal IAM du compte de consommateur de données. -
Le responsable des données du producteur de données examine la demande du consommateur de données et donne son approbation si toutes les exigences sont satisfaites.
-
Select
l'accès est accordé, ce qui permet au principal IAM de consommer les données demandées.