Processi (legacy) - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Processi (legacy)

Uno script contiene il codice che estrae, trasforma e carica il lavoro (ETL). Puoi fornire uno script personalizzato oppure AWS Glue può generare uno script seguendo le tue indicazioni. Per informazioni su come creare gli script, consulta Fornire i propri script personalizzati.

Puoi modificare uno script nella console AWS Glue. Quando modifichi uno script, puoi aggiungere origini, destinazioni e trasformazioni.

Per modificare uno script
  1. Accedi alla AWS Management Console, quindi apri la console AWS Glue all'indirizzo https://console.aws.amazon.com/glue/. Selezionare Processi scheda.

  2. Scegli un processo nell'elenco, quindi Action (Operazione), Edit script (Modifica script) per aprire l'editor di script.

    Puoi inoltre accedere all'editor di script dalla pagina dei dettagli del processo. Scegli la scheda Script, quindi scegli Edit script (Modifica script).

Editor di script

L'editor di script AWS Glue permette di inserire, modificare ed eliminare origini, destinazioni e trasformazioni nello script. L'editor di script visualizza sia lo script sia un diagramma per aiutarti a visualizzare il flusso di dati.

Per creare un diagramma per lo script, scegli Generate diagram (Genera diagramma). AWS Glue usa righe di annotazione nello script che iniziano con # # per visualizzare il diagramma. Per rappresentare correttamente lo script nel diagramma, è necessario mantenere sincronizzati i parametri nelle annotazioni e i parametri nel codice Apache Spark.

L'editor di script ti consente di aggiungere modelli di codice ovunque il cursore sia posizionato nello script. Nella parte superiore dell'editor, sceglie tra le seguenti opzioni:

  • Per aggiungere una tabella di origine allo script, scegli Source (Origine).

  • Per aggiungere una tabella di destinazione allo script, scegli Target (Destinazione).

  • Per aggiungere una posizione di destinazione allo script, scegli Target location (Posizione di destinazione).

  • Per aggiungere una trasformazione allo script, scegli Transform (Trasformazione). Per informazioni sulle funzioni richiamate nel tuo script, consulta Programma gli script AWS Glue ETL in PySpark.

  • Per aggiungere una trasformazione Spigot allo script, scegli Spigot.

Nel codice inserito, modifica i parameters nelle annotazioni e nel codice Apache Spark. Ad esempio, se aggiungi una trasformazione Spigot, verifica che path sia sostituito sia nella riga di annotazione @args sia nella riga di codice output.

La scheda Logs (Log) mostra i log che sono associati al tuo processo durante l'esecuzione. Vengono visualizzate le 1.000 righe più recenti.

La scheda Schema mostra lo schema delle origini e delle destinazioni selezionate, quando disponibili nel catalogo dati.