Utiliser une landing zone pour masquer des données sensibles

Gestion des données sensibles

En général, les données sensibles contiennent des informations personnelles ou confidentielles qui doivent être sécurisées pour des raisons légales ou de conformité. Si le chiffrement n'est requis qu'au niveau d'une ligne ou d'une colonne, nous vous recommandons d'utiliser une couche de landing zone. Il s'agit de données partiellement sensibles.

Toutefois, si l'ensemble de données est considéré comme sensible, nous vous recommandons d'utiliser des compartiments Amazon Simple Storage Service (Amazon Simple Storage Service (Amazon Simple Storage Service (Amazon S3) Amazon Simple Storage Service (Amazon Simple Storage Service (Amazon Simple Storage Il s'agit de données très sensibles. Ces compartiments S3 distincts doivent être utilisés pour chaque couche de données et le terme « sensible » doit être inclus dans le nom du compartiment. Nous vous recommandons de chiffrer les compartiments sensibles avec AWS Key Management Service(AWS KMS) à l'aide du chiffrement côté client. Vous devez également utiliser le chiffrement côté client pour chiffrer lesAWS Glue tâches qui transforment vos données.

Utiliser une landing zone pour masquer des données sensibles

Vous pouvez utiliser une couche de landing zone pour les ensembles de données partiellement sensibles (par exemple, si le chiffrement n'est requis qu'au niveau de la ligne ou de la colonne). Ces données sont ingérées dans le compartiment S3 de la zone d'atterrissage, puis masquées. Une fois les données masquées, elles sont ingérées dans le compartiment S3 de la couche brute qui est chiffrée à l'aide du chiffrement côté serveur avec des clés gérées par Amazon S3 (SSE-S3). Si nécessaire, vous pouvez baliser les données au niveau de l'objet.

Toutes les données déjà masquées peuvent contourner la landing zone et être directement ingérées dans le compartiment S3 de la couche brute. Il existe deux niveaux d'accès dans les couches de stage et d'analyse pour les ensembles de données partiellement sensibles ; un niveau offre un accès complet à toutes les données et l'autre niveau n'a accès qu'aux lignes et colonnes non sensibles.

Le schéma suivant montre un lac de données dans lequel les ensembles de données partiellement sensibles utilisent une landing zone pour masquer les données sensibles, tandis que les ensembles de données très sensibles utilisent des compartiments S3 chiffrés séparés. La landing zone est isolée à l'aide de politiques restrictives relatives aux compartiments IAM et S3, et les compartiments chiffrés utilisent le chiffrement côté client avecAWS KMS.

Le flux de processus montre un lac de données dans lequel les ensembles de données partiellement sensibles utilisent une landing zone pour masquer les données sensibles, tandis que les ensembles de données très sensibles utilisent des compartiments S3 chiffrés séparés. La landing zone est isolée à l'aide de politiques restrictives relatives aux compartiments IAM et S3, et les compartiments chiffrés utilisent le chiffrement côté client avecAWS KMS.

Le diagramme décrit le flux de travail suivant :

Les données très sensibles sont envoyées vers un compartiment S3 chiffré dans la couche de données brutes.
UneAWS Glue tâche valide et transforme les données dans un format prêt à être consommé, puis place le fichier dans un compartiment S3 chiffré situé dans la couche intermédiaire.
UneAWS Glue tâche agrège les données en fonction des besoins de l'entreprise et les place dans un compartiment S3 chiffré situé dans la couche analytique.
Les données partiellement sensibles sont envoyées au compartiment de landing zone.
Les lignes et les colonnes sensibles sont masquées et les données sont ensuite envoyées au compartiment S3 dans la couche brute.
Les données non sensibles sont directement envoyées au compartiment S3 dans la couche brute.
UneAWS Glue tâche valide et transforme les données dans un format prêt à être consommé et place les fichiers dans le compartiment S3 pour la couche intermédiaire.
UneAWS Glue tâche agrège les données en fonction des exigences de votre entreprise et les place dans un compartiment S3 de la couche analytique.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Associer les compartiments S3 aux politiques IAM de votre lac de données

FAQ