Prepara i dati utilizzando sessioni interattive AWS Glue - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Prepara i dati utilizzando sessioni interattive AWS Glue

AWS Glue le sessioni interattive sono un ambiente di runtime Apache Spark on-demand e senza server che i data scientist e gli ingegneri dei dati possono utilizzare per creare, testare ed eseguire rapidamente applicazioni di preparazione e analisi dei dati.

È possibile avviare una sessione AWS Glue interattiva avviando un JupyterLab notebook in Studio o Studio Classic. Quando avviate il notebook, scegliete il sistema integrato Glue PySpark and Ray o il Glue Spark kernel. Questo avvia automaticamente una sessione Spark interattiva e senza server. Non è necessario fornire o gestire alcun cluster o infrastruttura di elaborazione. Dopo l'inizializzazione, puoi esplorare AWS Glue Data Catalog, eseguire query complesse e analizzare e preparare i dati in modo interattivo utilizzando Spark nei tuoi notebook Studio o Studio Classic. Puoi quindi utilizzare i dati preparati per creare, addestrare, ottimizzare e distribuire modelli utilizzando gli strumenti di machine learning appositamente progettati all'interno. SageMaker

Prima di iniziare la sessione AWS Glue interattiva in Studio o Studio Classic, è necessario impostare i ruoli e le politiche appropriati. Inoltre, potrebbe essere necessario fornire l'accesso a risorse aggiuntive, come un bucket di storage Amazon S3. Per ulteriori informazioni sulle politiche IAM richieste, consulta. Autorizzazioni per sessioni AWS Glue interattive in Studio o Studio Classic

Studio e Studio Classic forniscono una configurazione predefinita per la sessione AWS Glue interattiva, tuttavia, puoi utilizzare il catalogo completo AWS Glue di comandi magici di Jupyter per personalizzare ulteriormente il tuo ambiente. Per informazioni sui Jupyter magics predefiniti e aggiuntivi che puoi usare nella tua sessione interattiva, consulta. AWS Glue Configura la tua sessione AWS Glue interattiva in Studio o Studio Classic

  • Gli utenti di Studio Classic che iniziano una sessione AWS Glue interattiva, possono scegliere tra le seguenti immagini e kernel:

    • Immagini:, SparkAnalytics 1.0 SparkAnalytics 2.0

    • Kernel: Glue Python [PySpark and Ray] e Glue Spark

  • Per gli utenti di Studio, utilizzate l'immagine di SageMaker distribuzione predefinita e selezionate uno Glue Python [PySpark and Ray] o un Glue Spark kernel.