Prepara i dati con Amazon EMR - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Prepara i dati con Amazon EMR

Amazon SageMaker Studio Classic è dotato dell'integrazione integrata di Amazon EMR, con cui data scientist e data engineer possono eseguire la preparazione interattiva dei dati e l'apprendimento automatico (ML) su scala petabyte direttamente dal proprio notebook Studio Classic. All'interno di un notebook, possono scoprire e connettersi ai cluster Amazon EMR esistenti, quindi esplorare, visualizzare e preparare in modo interattivo dati su larga scala per il machine learning utilizzando Apache Spark, Apache Hive, Presto. Inoltre, gli utenti possono accedere all'interfaccia utente di Spark con un solo clic per monitorare i lavori in Spark dai notebook Studio Classic.

Gli amministratori possono utilizzare il AWS Service Catalogper definire AWS CloudFormation modelli di cluster Amazon EMR accessibili agli utenti di Studio Classic. I data scientist possono quindi scegliere un modello predefinito per il provisioning autonomo di un cluster Amazon EMR direttamente dai notebook Amazon SageMaker Studio Classic. Gli amministratori possono definire ulteriormente i parametri dei modelli per consentire agli utenti di scegliere gli aspetti del cluster in base ai propri carichi di lavoro entro valori predefiniti. Ad esempio, un data scientist o un ingegnere dei dati potrebbe voler specificare il numero di nodi principali del cluster fino a un valore massimo predeterminato oppure selezionare il tipo di istanza di un nodo da un menu a discesa.