Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Étape 3 : Création de bases de données Lake Formation
Au cours de cette étape, vous créez deux bases de données et attachez des balises LF aux bases de données et à des colonnes spécifiques à des fins de test.
Créez vos bases de données et votre table pour un accès au niveau de la base de données
-
Créez d'abord la base de données
tag_database
, la tablesource_data
et attachez les balises LF appropriées.Sur la console Lake Formation (https://console.aws.amazon.com/lakeformation/
), sous Data Catalog, sélectionnez Databases. Choisissez Créer une base de données.
Pour Name (Nom), saisissez
tag_database
.Dans Emplacement, entrez l'emplacement Amazon S3 créé par le AWS CloudFormation modèle
(s3://lf-tagbased-demo-
.Account-ID
/tag_database/)Désélectionnez Utiliser uniquement le contrôle d'accès IAM pour les nouvelles tables de cette base de données.
Choisissez Créer une base de données.
-
Ensuite, créez une nouvelle table à l'intérieur
tag_database
.Sur la page Bases de données, sélectionnez la base de données
tag_database
.Choisissez Afficher les tables, puis cliquez sur Créer une table.
Pour Name (Nom), saisissez
source_data
.Pour Database (Base de données), choisissez la base de données
tag_database
.Pour Format de tableau, choisissez AWS Glue Tableau standard.
Si les données se trouvent dans, sélectionnez le chemin spécifié dans mon compte.
Pour Inclure le chemin, entrez le chemin
tag_database
créé par le AWS CloudFormation modèle(s3://lf-tagbased-demo
.Account-ID
/tag_database/)Pour le format des données, sélectionnez CSV.
Sous Charger le schéma, entrez le tableau JSON suivant de structure de colonne pour créer un schéma :
[ { "Name": "vendorid", "Type": "string" }, { "Name": "lpep_pickup_datetime", "Type": "string" }, { "Name": "lpep_dropoff_datetime", "Type": "string" }, { "Name": "store_and_fwd_flag", "Type": "string" }, { "Name": "ratecodeid", "Type": "string" }, { "Name": "pulocationid", "Type": "string" }, { "Name": "dolocationid", "Type": "string" }, { "Name": "passenger_count", "Type": "string" }, { "Name": "trip_distance", "Type": "string" }, { "Name": "fare_amount", "Type": "string" }, { "Name": "extra", "Type": "string" }, { "Name": "mta_tax", "Type": "string" }, { "Name": "tip_amount", "Type": "string" }, { "Name": "tolls_amount", "Type": "string" }, { "Name": "ehail_fee", "Type": "string" }, { "Name": "improvement_surcharge", "Type": "string" }, { "Name": "total_amount", "Type": "string" }, { "Name": "payment_type", "Type": "string" } ]
Sélectionnez Charger. Après avoir chargé le schéma, le schéma de table doit ressembler à la capture d'écran suivante :
Sélectionnez Envoyer.
-
Ensuite, attachez des balises LF au niveau de la base de données.
Sur la page Bases de données, recherchez et sélectionnez
tag_database
.Dans le menu Actions, choisissez Modifier les balises LF.
Choisissez Attribuer un nouveau tag LF.
Pour les clés assignées, choisissez le
Confidential
tag LF que vous avez créé précédemment.Dans le champ Valeurs, sélectionnez
True
.Choisissez Enregistrer.
Ceci termine l'attribution du tag LF à la base de données tag_database.
Créez votre base de données et votre table pour un accès au niveau des colonnes
Répétez les étapes suivantes pour créer la base de données col_tag_database
et la tablesource_data_col_lvl
, et attachez des balises LF au niveau de la colonne.
Sur la page Bases de données, sélectionnez Créer une base de données.
-
Pour Name (Nom), saisissez
col_tag_database
. -
Dans Emplacement, entrez l'emplacement Amazon S3 créé par le AWS CloudFormation modèle
(s3://lf-tagbased-demo-
.Account-ID
/col_tag_database/) -
Désélectionnez Utiliser uniquement le contrôle d'accès IAM pour les nouvelles tables de cette base de données.
-
Choisissez Créer une base de données.
Sur la page Bases de données, sélectionnez votre nouvelle base de données
(col_tag_database)
.Choisissez Afficher les tables, puis cliquez sur Créer une table.
Pour Name (Nom), saisissez
source_data_col_lvl
.Dans Base de données, choisissez votre nouvelle base de données
(col_tag_database)
.Pour Format de tableau, choisissez AWS Glue Tableau standard.
Si les données se trouvent dans, sélectionnez le chemin spécifié dans mon compte.
Entrez le chemin Amazon S3 pour
col_tag_database
(s3://lf-tagbased-demo-
.Account-ID
/col_tag_database/)Pour Format des données, sélectionnez
CSV
.Sous
Upload schema
, entrez le schéma JSON suivant :[ { "Name": "vendorid", "Type": "string" }, { "Name": "lpep_pickup_datetime", "Type": "string" }, { "Name": "lpep_dropoff_datetime", "Type": "string" }, { "Name": "store_and_fwd_flag", "Type": "string" }, { "Name": "ratecodeid", "Type": "string" }, { "Name": "pulocationid", "Type": "string" }, { "Name": "dolocationid", "Type": "string" }, { "Name": "passenger_count", "Type": "string" }, { "Name": "trip_distance", "Type": "string" }, { "Name": "fare_amount", "Type": "string" }, { "Name": "extra", "Type": "string" }, { "Name": "mta_tax", "Type": "string" }, { "Name": "tip_amount", "Type": "string" }, { "Name": "tolls_amount", "Type": "string" }, { "Name": "ehail_fee", "Type": "string" }, { "Name": "improvement_surcharge", "Type": "string" }, { "Name": "total_amount", "Type": "string" }, { "Name": "payment_type", "Type": "string" } ]
Sélectionnez
Upload
. Après avoir chargé le schéma, le schéma de table doit ressembler à la capture d'écran suivante.Choisissez Soumettre pour terminer la création de la table.
-
Associez maintenant le
Sensitive=True
tag LF aux colonnesvendorid
et.fare_amount
Sur la page Tables, sélectionnez la table que vous avez créée
(source_data_col_lvl)
.Dans le menu Actions, sélectionnez Schéma.
Sélectionnez la colonne
vendorid
et choisissez Modifier les balises LF.Pour Clés attribuées, choisissez Sensitive.
Dans le champ Valeurs, sélectionnez Vrai.
Choisissez Enregistrer.
-
Ensuite, associez le
Confidential=False
tag LF à.col_tag_database
Cela est nécessaire pourlf-data-analyst
pouvoir décrire la base de donnéescol_tag_database
lorsque vous êtes connecté depuis Amazon Athena.Sur la page Bases de données, recherchez et sélectionnez
col_tag_database
.Dans le menu Actions, choisissez Modifier les balises LF.
Choisissez Attribuer un nouveau tag LF.
Pour les clés attribuées, choisissez le
Confidential
tag LF que vous avez créé précédemment.Dans le champ Valeurs, sélectionnez
False
.Choisissez Enregistrer.