Aggiungendo parametri di origine e destinazione al nodo AWS Glue Data Catalog - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Aggiungendo parametri di origine e destinazione al nodo AWS Glue Data Catalog

AWS Glue Studio consente di parametrizzare i processi visivi. Poiché i nomi delle tabelle di catalogo nell'ambiente di produzione e sviluppo possono essere diversi, è possibile definire e selezionare i parametri di runtime per database e tabelle che verranno eseguiti durante l'esecuzione del processo.

La parametrizzazione dei processi consente di parametrizzare origini e destinazioni e di salvare tali parametri sul processo quando usi il nodo AWS Glue Data Catalog. Quando si specificano origini e destinazioni come parametri, si abilita la riutilizzabilità dei processi, in particolare quando si utilizza lo stesso processo in più ambienti. Questo è utile quando si promuove il codice negli ambienti di implementazione, risparmiando tempo e fatica nella gestione delle origini e delle destinazioni. Inoltre, i parametri personalizzati specificati sostituiranno qualsiasi argomento predefinito per esecuzioni specifiche di processi AWS Glue.

Aggiungere parametri di origine e destinazione

Sia che si stia usando il nodo AWS Glue Data Catalog come origine o destinazione, puoi definire i parametri di runtime nella sezione Proprietà avanzate nella scheda Dettagli del processo.

  1. Scegli il nodo AWS Glue Data Catalog come nodo di origine o nodo di destinazione.

  2. Seleziona la scheda Job details (Dettagli del processo).

  3. Scegli Proprietà avanzate.

  4. Nella sezione Parametri del processo, inserisci un valore chiave. Ad esempio,--db.source sarebbe il parametro per un database di origine. Puoi inserire qualsiasi nome come chiave, purché il nome della chiave sia seguito da “trattino trattino”.

    Lo screenshot mostra la sezione dei parametri del processo nella scheda Dettagli del processo. È possibile definire i parametri da utilizzare durante il runtime per il Database e la Tabella.
  5. Inserire il valore. Ad esempio, databasename sarebbe il valore per la parametrizzazione del database.

  6. Scegli Aggiunta nuovo parametro se si desidera aggiungere altri parametri. Sono consentiti fino a 50 parametri. Una volta definita la coppia di valori chiave, puoi utilizzare il parametro nel nodo AWS Glue Data Catalog.

Selezionare un parametro di runtime

Nota

Il processo di selezione dei parametri di runtime per database e tabelle è lo stesso indipendentemente dal fatto che il nodo AWS Glue Data Catalog sia l'origine o la destinazione.

  1. Scegli il nodo AWS Glue Data Catalog come nodo di origine o nodo di destinazione.

  2. Nella scheda Proprietà dell'origine dei dati: Data Catalog , sotto Database, scegli Usa parametri di runtime.

    Lo screenshot mostra il menu a discesa dei parametri di runtime. È possibile selezionare qualsiasi parametro definito da utilizzare durante il runtime per il Database e la Tabella.
  3. Scegli un parametro dal menu a discesa. Ad esempio, quando si seleziona un parametro definito per un database di origine, il database verrà inserito automaticamente nel menu a discesa del database quando si sceglie Applicazione.

  4. Nella sezione Tabella, scegli un parametro già definito come tabella di origine. Quando si sceglie Applicazione, la tabella viene inserita automaticamente come tabella da utilizzare.

  5. Quando si salva e si esegue il processo, AWS Glue Studio farà riferimento ai parametri selezionati durante l'esecuzione del processo.