Étape 8 : Utiliser un plan pour créer un flux de travail

Le AWS Lake Formation flux de travail génère les AWS Glue tâches, les robots d'exploration et les déclencheurs qui découvrent et ingèrent les données dans votre lac de données. Vous créez un flux de travail basé sur l'un des plans prédéfinis de Lake Formation.

Sur la console Lake Formation, dans le volet de navigation, choisissez Blueprints, puis Use blueprint.
Sur la page Utiliser un plan, sous Type de plan, choisissez Instantané de base de données.
Sous Importer la source, pour Connexion à la base de données, choisissez la connexion que vous venez de créer ou choisissez une connexion existante pour votre source de données. datalake-tutorial
Dans le champ Chemin des données source, entrez le chemin à partir duquel les données seront ingérées dans le formulaire<database>/<schema>/<table>.

Vous pouvez remplacer le caractère générique pour le pourcentage (%) par le schéma ou le tableau. <schema><database>Pour les bases de données qui prennent en charge les schémas, entrez<database>/<schema>/% pour qu'il corresponde à toutes les tables qu'elles contiennent. Oracle Database et MySQL ne prennent pas en charge le schéma dans le chemin ; entrez plutôt <database>/%. Pour Oracle Database, <database>c'est l'identifiant du système (SID).

Par exemple, si une base de données Oracle a orcl orcl/% pour SID, entrez toutes les tables auxquelles l'utilisateur indiqué dans la connexion JDCB a accès.

Important
Ce champ est sensible à la casse.

Sous Cible d'importation, spécifiez les paramètres suivants :

Base de données cible	`lakeformation_tutorial`
Emplacement de stockage cible	`s3://<yourName>-datalake-tutorial`
Format de données	(Choisissez Parquet ou CSV)

Pour la fréquence d'importation, choisissez Exécuter à la demande.

Sous Options d'importation, spécifiez les paramètres suivants :

Nom du flux de travail	`lakeformationjdbctest`
Rôle IAM	`LakeFormationWorkflowRole`
Préfixe de table	`jdbctest` Note Doit être en minuscules.

Choisissez Créer et attendez que la console indique que le flux de travail a été créé avec succès.

Astuce
Avez-vous reçu le message d'erreur suivant ?
User: arn:aws:iam::<account-id>:user/<datalake_administrator_user> is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...
Si tel est le cas, vérifiez que vous avez remplacé <account-id>dans la politique en ligne l'utilisateur administrateur du lac de données par un numéro de AWS compte valide.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Étape 7 : Accorder des autorisations de données

Étape 9 : Exécuter le flux de travail

Étape 8 : Utiliser un plan pour créer un flux de travail

Important

Note

Astuce