Fase 8: Utilizzare un blueprint per creare un flusso di lavoro - AWS Lake Formation

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Fase 8: Utilizzare un blueprint per creare un flusso di lavoro

Il AWS Lake Formation flusso di lavoro genera i AWS Glue job, i crawler e i trigger che rilevano e inseriscono dati nel tuo data lake. Crei un flusso di lavoro basato su uno dei blueprint predefiniti di Lake Formation.

  1. Nella console Lake Formation, nel pannello di navigazione, scegli Blueprints, quindi scegli Usa blueprint.

  2. Nella pagina Usa un blueprint, in Tipo di blueprint, scegli Database snapshot.

  3. In Origine di importazione, per Connessione al database, scegli la connessione che hai appena creato o scegli una connessione esistente per la tua origine dati. datalake-tutorial

  4. Per Percorso dei dati di origine, inserisci nel modulo <database>/<schema>/<table> il percorso da cui importare i dati.

    È possibile sostituire lo schema o la tabella con il carattere jolly percentuale (%). <schema><database>Per i database che supportano gli schemi, inserisci<database>/<schema>/% per far corrispondere tutte le tabelle contenute all'interno. <database>Oracle Database e MySQL non supportano lo schema nel percorso; inserisci invece /%. Per Oracle Database, <database>è l'identificatore di sistema (SID).

    Ad esempio, se un database Oracle ha orcl come SID, immettilo in modo che orcl/% corrisponda a tutte le tabelle a cui ha accesso l'utente specificato nella connessione JDCB.

    Importante

    Questo campo fa distinzione tra minuscole e maiuscole.

  5. In Import target, specifica questi parametri:

    Database di destinazione lakeformation_tutorial
    Posizione di archiviazione di destinazione s3://<yourName>-datalake-tutorial
    Formato dei dati (Scegli Parquet o CSV)
  6. Per la frequenza di importazione, scegli Esegui su richiesta.

  7. In Opzioni di importazione, specificate questi parametri:

    Nome del flusso di lavoro lakeformationjdbctest
    Ruolo IAM LakeFormationWorkflowRole
    Prefisso della tabella jdbctest
    Nota

    Deve essere in lettere minuscole.

  8. Scegli Crea e attendi che la console segnali che il flusso di lavoro è stato creato correttamente.

    Suggerimento

    Hai ricevuto il seguente messaggio di errore?

    User: arn:aws:iam::<account-id>:user/<datalake_administrator_user> is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...

    In tal caso, verifica di aver sostituito <account-id>nella politica in linea per l'utente amministratore del data lake un numero di AWS account valido.