Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Amazon EMR Studio
Amazon EMR Studio è un ambiente di sviluppo integrato (IDE) basato sul Web per notebook Jupyter completamente gestiti che vengono eseguiti su cluster Amazon EMR. Puoi configurare un EMR Studio per il tuo team per sviluppare, visualizzare ed eseguire il debug di applicazioni scritte in R, Python, Scala ePySpark. EMR Studio è integrato con AWS Identity and Access Management (IAM) e IAM Identity Center per consentire agli utenti di accedere utilizzando le proprie credenziali aziendali.
È possibile creare un EMR Studio in modo totalmente gratuito. Quando si utilizza EMR Studio, si applicano i costi applicabili per l'archiviazione Amazon S3 e per i cluster Amazon EMR. Per i dettagli e le caratteristiche principali del prodotto, consulta la pagina del servizio per Amazon EMR Studio
Caratteristiche principali di EMR Studio
Amazon EMR Studio offre le seguenti caratteristiche:
-
Autentica gli utenti con AWS Identity and Access Management (IAM) o AWS IAM Identity Center (successor to AWS Single Sign-On) (IAM Identity Center) e il tuo provider di identità aziendale.
-
Accedi e avvia i cluster Amazon EMR su richiesta per eseguire i processi di Jupyter Notebook.
-
Connetti ai cluster Amazon EMR su EKS per inviare il lavoro durante l'esecuzione del processo.
-
Esplora e salva notebook di esempio. Per ulteriori informazioni sui notebook di esempio, vedereEsempi di notebook EMR StudioGitHubmagazzino
. -
Analizza i dati usando Python,PySpark, Spark Scala, Spark R o SparkSQL e installa kernel e librerie personalizzati.
-
Collabora in tempo reale con altri utenti nello stesso WorkSpace. Per ulteriori informazioni, consulta Configurazione della collaborazione di WorkSpace.
-
Utilizza SQL Explorer di EMR Studio per sfogliare il catalogo dati, eseguire query SQL e scaricare i risultati prima di lavorare con i dati in un notebook.
-
Esegui notebook con parametri come parte di flussi di lavoro pianificati con uno strumento di orchestrazione come Apache Airflow o Amazon Managed Workflows per Apache Airflow. Per ulteriori informazioni, consulta Orchestrazione dei processi di analisi dei dati EMR Notebooks utilizzando MWAA
nel Blog sui Big Data AWS. -
Archivi di codici di collegamento comeGitHubeBitBucket.
-
Monitora ed esegui il debug dei processi utilizzando Spark History Server, l'interfaccia utente Tez o il Timeline Server di YARN.
EMR Studio è inoltre idoneo a HIPAA ed è certificato secondo HITRUST CSF e SOC 2. Per ulteriori informazioni sulla conformità HIPAA per i servizi AWS, consulta http://aws.amazon.com/compliance/hipaa-compliance/
Cronologia delle funzionalità di Amazon EMR Studio
Questa tabella elenca gli aggiornamenti della funzionalità di dimensionamento gestito da Amazon EMR.
Data di rilascio | Funzionalità |
---|---|
28 febbraio 2023 |
AggiuntaAWS KMSsupporto chiave gestito dal cliente per l'archiviazione dei log delle applicazioni per applicazioni EMR Serverless. |
23 febbraio 2023 |
È stata aggiunta la creazione di ruoli IAM con un clic per l'invio di offerte di lavoro EMR Serverless. È stata aggiunta la ricerca ECR per quando si seleziona un'immagine personalizzata per le applicazioni EMR Serverless. |
27 gennaio 2023 |
I notebook di esecuzione headless possono monitorare l'avanzamento dell'esecuzione di ogni cella con |
23 gennaio 2023 |
Le applicazioni persistenti sono state ottimizzate per tempi di avvio più rapidi. |