Amazon EMR Studio - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Amazon EMR Studio

Amazon EMR Studio ist eine webbasierte integrierte Entwicklungsumgebung (IDE) für vollständig verwaltete Jupyter Notebooks, die auf Amazon-EMR-Clustern ausgeführt werden. Sie können ein EMR Studio für Ihr Team einrichten, um in R, Python, Scala und geschriebene Anwendungen zu entwickeln, zu visualisieren und zu debuggen PySpark. EMR Studio ist in AWS Identity and Access Management (IAM) und IAM Identity Center integriert, sodass sich Benutzer mit ihren Unternehmensanmeldedaten anmelden können.

Sie können ein EMR Studio kostenlos erstellen. Wenn Sie EMR Studio verwenden, fallen Gebühren für Amazon-S3-Speicher und Amazon-EMR-Cluster an. Highlights, weitere Produktdetails und Preise finden Sie auf der Serviceseite für Amazon EMR Studio.

Hauptfeatures von EMR Studio

Amazon EMR Studio bietet die folgenden Features:

  • Authentifizieren Sie Benutzer mit AWS Identity and Access Management (IAM) oder AWS IAM Identity Center mit oder ohne Verbreitung vertrauenswürdiger Identitäten und Ihrem Unternehmensidentitätsanbieter.

  • Greifen Sie bei Bedarf auf Amazon-EMR-Cluster zu und starten Sie sie, um Jupyter-Notebook-Aufträge auszuführen.

  • Stellen Sie auf EKS-Clustern eine Verbindung zu Amazon EMR her, um Arbeit einzureichen, während der Auftrag ausgeführt wird.

  • Erkunden und speichern Sie Beispiel-Notebooks. Weitere Informationen zu Beispiel-Notebooks finden Sie im EMR Studio Notebook-Beispiel- GitHub Repository .

  • Analysieren Sie Daten mit Python, PySpark, Spark Scala, Spark R oder SparkSQL und installieren Sie benutzerdefinierte Kernel und Bibliotheken.

  • Arbeiten Sie in Echtzeit mit anderen Benutzern in demselben Workspace zusammen. Weitere Informationen finden Sie unter Konfigurieren Sie die Zusammenarbeit im Workspace.

  • Verwenden Sie den EMR Studio SQL Explorer, um Ihren Datenkatalog zu durchsuchen, SQL-Abfragen auszuführen und Ergebnisse herunterzuladen, bevor Sie mit den Daten in einem Notebook arbeiten.

  • Führen Sie parametrisierte Notebooks als Teil von geplanten Workflows mit einem Orchestrierungstool wie Apache Airflow oder Amazon Managed Workflows für Apache Airflow aus. Weitere Informationen finden Sie unter Orchestrieren von Analyseaufträgen auf EMR Notebooks mithilfe von MWAA im AWS-Big-Data-Blog.

  • Verknüpfen Sie Code-Repositorys wie GitHub und BitBucket.

  • Verfolgen und debuggen Sie Jobs mit dem Spark History Server, der Tez-Benutzeroberfläche oder dem YARN-Timeline-Server.

EMR Studio ist auch HIPAA-fähig und nach HITRUST CSF und SOC 2 zertifiziert. Weitere Informationen über HIPAA-Compliance für AWS-Services finden Sie unter https://aws.amazon.com/compliance/hipaa-compliance/. Weitere Informationen zur HITRUST CSF-Konformität für AWS-Services finden Sie unter https://aws.amazon.com/compliance/hitrust/. Weitere Informationen zu anderen Compliance-Programmen für AWS-Services finden Sie unter AWS-Services im Leistungsumfang nach Compliance-Programmen.

Verlauf der Features von Amazon EMR Studio

In dieser Tabelle sind Aktualisierungen zur Funktion Amazon EMR Managed Scaling aufgeführt.

Datum der Veröffentlichung Funktion
5. Januar 2024

Unterstützung für EMR Studio wurde in AWS GovCloud (USA-Ost) und AWS GovCloud (USA-West) hinzugefügt.

26. November 2023

Unterstützung für die Verbeitung vertrauenswürdiger Identitäten für EMR Studio mit IAM-Identity-Center-Authentifizierung hinzugefügt.

26. Oktober 2023

Es wurde die Möglichkeit hinzugefügt, eine Serverless-EMR-Anwendung mit interaktiven Funktionen zu erstellen.

28. Februar 2023

Kundenverwaltete AWS KMS-Schlüsselunterstützung für die Speicherung von Anwendungsprotokollen für Serverless-EMR-Anwendungen hinzugefügt.

23. Februar 2023

Es wurde die Erstellung von IAM-Rollen mit einem Klick für die Serverless-EMR-Auftragsübermittlung hinzugefügt. ECR-Suche hinzugefügt, wenn Sie ein benutzerdefiniertes Image für EMR-Serverless-Anwendungen auswählen.

27. Januar 2023

Notebooks mit Headless-Ausführung können den Fortschritt jeder einzelnen Zellenausführung %execute_notebook auf magische Weise verfolgen.

23. Januar 2023

Persistente Anwendungen wurden für schnellere Startzeiten optimiert.