Amazon EMR Studio - Amazon EMR

Amazon EMR Studio

Amazon EMR Studio è un ambiente di sviluppo integrato (IDE) basato sul Web per notebook Jupyter completamente gestiti che vengono eseguiti su cluster Amazon EMR. Puoi configurare un EMR Studio per il tuo team per sviluppare, visualizzare ed eseguire il debug di applicazioni scritte in R, Python, Scala e PySpark. EMR Studio è integrato con AWS Identity and Access Management (IAM) e IAM Identity Center per consentire agli utenti di accedere utilizzando le proprie credenziali aziendali.

È possibile creare un EMR Studio in modo totalmente gratuito. Quando si utilizza EMR Studio, si applicano i costi applicabili per l'archiviazione Amazon S3 e per i cluster Amazon EMR. Per i dettagli e le caratteristiche principali del prodotto, consulta la pagina del servizio per Amazon EMR Studio.

Funzionalità principali di EMR Studio

Amazon EMR Studio offre le seguenti funzionalità:

  • Autentica gli utenti con AWS Identity and Access Management (IAM) o AWS IAM Identity Center (IAM Identity Center) e il tuo provider di identità aziendale.

  • Accedi e avvia i cluster Amazon EMR su richiesta per eseguire i processi di notebook Jupyter.

  • Connetti ai cluster Amazon EMR su EKS per inviare il lavoro durante l'esecuzione del processo.

  • Esplora e salva notebook di esempio. Per ulteriori informazioni sui notebook di esempio, consulta il repository GitHub dei notebook EMR Studio di esempio.

  • Analizza i dati utilizzando Python, PySpark, Spark Scala, Spark R o SparkSQL e installa kernel e librerie personalizzati.

  • Collabora in tempo reale con altri utenti nello stesso Workspace. Per ulteriori informazioni, consulta Configurazione della collaborazione di WorkSpace.

  • Utilizza SQL Explorer di EMR Studio per sfogliare il catalogo dati, eseguire query SQL e scaricare i risultati prima di lavorare con i dati in un notebook.

  • Esegui notebook parametrizzati nell'ambito dei flussi di lavoro pianificati con uno strumento di orchestrazione come Apache Airflow o Amazon Managed Workflows per Apache Airflow. Per ulteriori informazioni, consulta Orchestrazione dei processi di analisi su Notebook EMR con MWAA nel blog AWS Big Data.

  • Repository del codice di collegamento come GitHub e BitBucket.

  • Monitora ed esegui il debug dei processi utilizzando Spark History Server, l'interfaccia utente Tez o il server della cronologia YARN.

EMR Studio è inoltre idoneo a HIPAA ed è certificato secondo HITRUST CSF e SOC 2. Per ulteriori informazioni sulla conformità HIPAA per i servizi AWS, consulta https://aws.amazon.com/compliance/hipaa-compliance/. Per ulteriori informazioni sulla conformità HITRUST CSF per i servizi AWS, consulta https://aws.amazon.com/compliance/hitrust/. Per ulteriori informazioni su altri programmi di conformità per i servizi AWS, consulta Servizi AWS coperti dal programma di conformità.

Cronologia delle funzionalità di Amazon EMR Studio

Questa tabella elenca gli aggiornamenti della funzionalità di dimensionamento gestito da Amazon EMR.

Data di rilascio Funzionalità
26 ottobre 2023

Aggiunta la possibilità di creare un'applicazione EMR Serverless con funzionalità interattive.

28 febbraio 2023

Aggiunto supporto per chiavi AWS KMS gestite dal cliente per l'archiviazione dei log delle applicazioni per le applicazioni EMR serverless.

23 febbraio 2023

Aggiunta creazione di ruoli IAM con un solo clic per l'invio di processi EMR serverless. Aggiunta ricerca ECR per quando si seleziona un'immagine personalizzata per le applicazioni EMR serverless.

27 gennaio 2023

I notebook di esecuzione headless possono tracciare l'avanzamento dell'esecuzione di ogni cella con %execute_notebook magic.

23 gennaio 2023

Le applicazioni persistenti sono state ottimizzate per consentire tempi di avvio più rapidi.