Étape 8 : Utiliser un plan pour créer un flux de travail - AWS Lake Formation

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Étape 8 : Utiliser un plan pour créer un flux de travail

Le AWS Lake Formation flux de travail génère les AWS Glue tâches, les robots d'exploration et les déclencheurs qui découvrent et ingèrent les données dans votre lac de données. Vous créez un flux de travail basé sur l'un des plans prédéfinis de Lake Formation.

  1. Sur la console Lake Formation, dans le volet de navigation, choisissez Blueprints, puis Use blueprint.

  2. Sur la page Utiliser un plan, sous Type de plan, choisissez Instantané de base de données.

  3. Sous Importer la source, pour Connexion à la base de données, choisissez la connexion que vous venez de créer ou choisissez une connexion existante pour votre source de données. datalake-tutorial

  4. Dans le champ Chemin des données source, entrez le chemin à partir duquel les données seront ingérées dans le formulaire<database>/<schema>/<table>.

    Vous pouvez remplacer le caractère générique pour le pourcentage (%) par le schéma ou le tableau. <schema><database>Pour les bases de données qui prennent en charge les schémas, entrez<database>/<schema>/% pour qu'il corresponde à toutes les tables qu'elles contiennent. Oracle Database et MySQL ne prennent pas en charge le schéma dans le chemin ; entrez plutôt <database>/%. Pour Oracle Database, <database>c'est l'identifiant du système (SID).

    Par exemple, si une base de données Oracle a orcl orcl/% pour SID, entrez toutes les tables auxquelles l'utilisateur indiqué dans la connexion JDCB a accès.

    Important

    Ce champ est sensible à la casse.

  5. Sous Cible d'importation, spécifiez les paramètres suivants :

    Base de données cible lakeformation_tutorial
    Emplacement de stockage cible s3://<yourName>-datalake-tutorial
    Format de données (Choisissez Parquet ou CSV)
  6. Pour la fréquence d'importation, choisissez Exécuter à la demande.

  7. Sous Options d'importation, spécifiez les paramètres suivants :

    Nom du flux de travail lakeformationjdbctest
    Rôle IAM LakeFormationWorkflowRole
    Préfixe de table jdbctest
    Note

    Doit être en minuscules.

  8. Choisissez Créer et attendez que la console indique que le flux de travail a été créé avec succès.

    Astuce

    Avez-vous reçu le message d'erreur suivant ?

    User: arn:aws:iam::<account-id>:user/<datalake_administrator_user> is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...

    Si tel est le cas, vérifiez que vous avez remplacé <account-id>dans la politique en ligne l'utilisateur administrateur du lac de données par un numéro de AWS compte valide.