Nozioni di base sulle trasformazioni visive personalizzate - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Nozioni di base sulle trasformazioni visive personalizzate

Per creare una trasformazione visiva personalizzata, completa la seguente procedura.

  • Fase 1. Creazione di un file di configurazione JSON

  • Fase 2. Implementazione della logica di trasformazione

  • Fase 3. Convalida della trasformazione visiva personalizzata

  • Fase 4. Aggiornamento della trasformazione visiva personalizzata in base alle necessità

  • Fase 5: Utilizzo della trasformazione visiva personalizzata in AWS Glue Studio

Inizia configurando il bucket Amazon S3 e continua con la Fase 1. Crea un file di configurazione JSON.

Prerequisiti

Le trasformazioni fornite dal cliente risiedono all'interno di un account AWS del cliente. Quell'account possiede le trasformazioni e quindi dispone di tutte le autorizzazioni per visualizzarle (ricerca e uso), modificarle o eliminarle.

Per utilizzare una trasformazione personalizzata in AWS Glue Studio, dovrai creare e caricare due file nel bucket delle risorse di Amazon S3 in quell'account AWS:

  • File Python: contiene la funzione di trasformazione.

  • File JSON: descrive la trasformazione. Questo è noto anche come file di configurazione necessario per definire la trasformazione.

Per accoppiare i file, utilizzate lo stesso nome per entrambi. Ad esempio:

  • myTransform.json

  • myTransform.py

Facoltativamente, puoi assegnare alla tua trasformazione visiva personalizzata un'icona personalizzata fornendo un file SVG contenente l'icona. Per accoppiare i file, utilizza lo stesso nome per l'icona:

  • myTransform.svg

AWS Glue Studio li abbinerà automaticamente utilizzando i rispettivi nomi dei file. I nomi dei file non possono essere uguali per nessun modulo esistente.

AWS Glue Studio importerà il file come modulo (ad esempio, import myTransform) nello script del processo. Pertanto, il nome del file deve seguire le stesse regole di denominazione impostate per i nomi delle variabili python (identificatori). In particolare, devono iniziare con una lettera o un carattere di sottolineatura e quindi essere composti interamente da lettere, numeri e/o trattini bassi.

Nota

Assicurati che il nome del file di trasformazione non sia in conflitto con i moduli python caricati esistenti (ad esempio, sys, array, copy ecc.) per evitare problemi di runtime imprevisti.

Configurazione del bucket Amazon S3

Le trasformazioni create vengono archiviate in Amazon S3 e sono di proprietà del tuo account AWS. È possibile creare nuove trasformazioni visive personalizzate semplicemente caricando i file (.json e .py) nella cartella delle risorse di Amazon S3 dove sono correntemente archiviati tutti gli script del processo (ad esempio, s3://aws-glue-assets-<accountid>-<region>/transforms). Se utilizzi un'icona personalizzata, carica anch'essa. Per impostazione predefinita, AWS Glue Studio leggerà tutti i file .json dalla cartella /transforms nello stesso bucket S3.