Panoramica sull'utilizzo dei notebook - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Panoramica sull'utilizzo dei notebook

AWS Glue Studio permette di creare processi in modo interattivo in un'interfaccia notebook basata su Jupyter Notebooks. Attraverso i notebook in AWS Glue Studio, è possibile modificare gli script di processo e visualizzare l'output senza dover eseguire un processo completo e modificare il codice di integrazione dei dati e visualizzare l'output senza dover eseguire un processo completo. Inoltre, è possibile aggiungere markdown e salvare i notebook come file con estensione .ipynb e script di processo. È possibile avviare un notebook senza installare software localmente o gestire server. Quando hai terminato di lavorare con il codice, AWS Glue Studio può convertire il notebook in un processo Glue con un semplice clic.

Alcuni dei vantaggi derivanti dall'utilizzo dei notebook sono:

  • Nessun cluster di cui effettuare il provisioning o da gestire

  • Nessun cluster inattivo da pagare

  • Nessuna configurazione iniziale richiesta

  • Non è richiesta l'installazione di notebook Jupyter

  • Lo stesso tempo di esecuzione/piattaforma di AWS Glue ETL

All'avvio di un notebook tramite AWS Glue Studio, tutti i passaggi di configurazione vengono eseguiti per te, in modo che tu possa esplorare i dati e iniziare a sviluppare lo script del processo dopo pochi secondi. AWS Glue Studio configura un notebook Jupyter con il kernel AWS Glue Jupyter. Per utilizzare questo notebook, non è necessario configurare VPC, connessioni di rete o endpoint di sviluppo.

Per creare processi utilizzando l'interfaccia notebook:

  • configura le autorizzazioni IAM necessarie

  • avvia una sessione notebook per creare un processo

  • scrivi codice nelle celle del notebook

  • esegui e testa il codice per visualizzare l'output

  • salva il processo

Dopo aver salvato il notebook, questo sarà un processo AWS Glue completo. È possibile gestire tutti gli aspetti del processo, ad esempio la pianificazione delle esecuzioni e l'impostazione dei parametri del processo e la visualizzazione della cronologia dell'esecuzione del processo direttamente accanto al notebook.