Erstellen Sie ein Studio EMR - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen Sie ein Studio EMR

Sie können ein EMR Studio für Ihr Team mit der EMR Amazon-Konsole oder dem erstellen AWS CLI. Das Erstellen einer Studio-Instanz ist Teil der Einrichtung von Amazon EMR Studio.

Voraussetzungen

Bevor Sie ein Studio erstellen, stellen Sie sicher, dass Sie die vorherigen Aufgaben in Richten Sie ein Amazon EMR Studio ein abgeschlossen haben.

Um ein Studio mit dem zu erstellen AWS CLI, sollten Sie die neueste Version installiert haben. Weitere Informationen finden Sie unter Installieren oder Aktualisierung auf die neueste Version von AWS CLI.

Wichtig

Deaktivieren Sie Proxy-Management-Tools wie FoxyProxy oder SwitchyOmega im Browser, bevor Sie ein Studio erstellen. Aktive Proxys können zu einer Netzwerkfehler-Fehlermeldung führen, wenn Sie Studio erstellen wählen.

Amazon EMR bietet Ihnen eine einfache Konsolenerfahrung zum Erstellen eines Studios, sodass Sie schnell mit den Standardeinstellungen beginnen können, um interaktive Workloads oder Batch-Jobs mit den Standardeinstellungen auszuführen. Durch das Erstellen eines EMR Studios wird auch eine EMR serverlose Anwendung erstellt, die für Ihre interaktiven Jobs bereit ist.

Wenn Sie die volle Kontrolle über die Einstellungen Ihres Studios haben möchten, können Sie Benutzerdefiniert wählen, wodurch Sie alle zusätzlichen Einstellungen konfigurieren können.

Interactive workloads
Um ein EMR Studio für interaktive Workloads zu erstellen
  1. Öffnen Sie die EMR Amazon-Konsole unter https://console.aws.amazon.com/emr.

  2. Wählen Sie in der linken Navigationsleiste unter EMRStudio die Option Erste Schritte aus. Sie können auf der Studio-Seite auch ein neues Studio erstellen.

  3. Amazon EMR bietet Standardeinstellungen für Sie, wenn Sie ein EMR Studio für interaktive Workloads erstellen, aber Sie können diese Einstellungen bearbeiten. Zu den konfigurierbaren Einstellungen gehören der Name des EMR Studios, der S3-Standort für Ihren Workspace, die zu verwendende Servicerolle, die Workspace (s), die Sie verwenden möchten, der Name der EMR serverlosen Anwendung und die zugehörige Runtime-Rolle.

  4. Wählen Sie Create Studio und starten Sie Workspace, um den Vorgang abzuschließen und zur Studios-Seite zu navigieren. Ihr neues Studio wird in der Liste mit Details wie Studio-Name, Erstellungsdatum und Studio-Zugriff angezeigtURL. Ihr Workspace wird in einem neuen Tab in Ihrem Browser geöffnet.

Batch jobs
Um ein EMR Studio für interaktive Workloads zu erstellen
  1. Öffnen Sie die EMR Amazon-Konsole unter https://console.aws.amazon.com/emr.

  2. Wählen Sie in der linken Navigationsleiste unter EMRStudio die Option Erste Schritte aus. Sie können auf der Studio-Seite auch ein neues Studio erstellen.

  3. Amazon EMR bietet Standardeinstellungen für Sie, wenn Sie ein EMR Studio für Batch-Jobs erstellen, aber Sie können diese Einstellungen bearbeiten. Zu den konfigurierbaren Einstellungen gehören der Name des EMR Studios, der Name der EMR serverlosen Anwendung und die zugehörige Runtime-Rolle.

  4. Wählen Sie Create Studio und starten Sie Workspace, um den Vorgang abzuschließen und zur Studios-Seite zu navigieren. Ihr neues Studio wird in der Liste mit Details wie Studio-Name, Erstellungsdatum und Studio-Zugriff angezeigtURL. Ihr EMR Studio wird in einem neuen Tab in Ihrem Browser geöffnet.

Custom settings
Um ein EMR Studio mit benutzerdefinierten Einstellungen zu erstellen
  1. Öffnen Sie die EMR Amazon-Konsole unter https://console.aws.amazon.com/emr.

  2. Wählen Sie in der linken Navigationsleiste unter EMRStudio die Option Erste Schritte aus. Sie können auf der Studio-Seite auch ein neues Studio erstellen.

  3. Wählen Sie Studio erstellen, um die Seite Studio erstellen zu öffnen.

  4. Geben Sie einen Studio-Namen ein.

  5. Wählen Sie, ob Sie einen neuen S3-Bucket erstellen oder einen vorhandenen Speicherort verwenden möchten.

  6. Wählen Sie den Workspace aus, der dem Studio hinzugefügt werden soll. Sie können bis zu 3 Arbeitsbereiche hinzufügen.

  7. Wählen Sie unter Authentifizierung einen Authentifizierungsmodus für das Studio und geben Sie die Informationen gemäß der folgenden Tabelle ein. Weitere Informationen zur Authentifizierung für EMR Studio finden Sie unterWählen Sie einen Authentifizierungsmodus für Amazon EMR Studio.

    Wenn Sie … Vorgehensweise
    IAMAuthentifizierung oder Verbund

    Die Standardauthentifizierungsmethode ist AWS Identity and Access Management (IAM). Am unteren Bildschirmrand können Sie auch Tags hinzufügen, um bestimmten Benutzern Zugriff auf das Studio zu gewähren, wie unter Weisen Sie einem EMR Studio einen Benutzer oder eine Gruppe zu beschrieben.

    Wenn Sie möchten, dass sich Verbundbenutzer mit Studio URL und Anmeldeinformationen für Ihren Identity Provider (IdP) anmelden, wählen Sie Ihren IdP aus der Dropdownliste aus und geben Sie Ihren Identity Provider-Anmeldenamen (IdP) und den Parameternamen ein. URL RelayState

    Eine Liste der IdP-Authentifizierung URLs und der RelayState Namen finden Sie unter RelayState Parameter und Authentifizierung des Identitätsanbieters URLs.

    IAMIdentity Center-Authentifizierung

    Wählen Sie Ihre EMR Studio-Dienstrolle und Ihre Benutzerrolle aus. Weitere Informationen erhalten Sie unter Erstellen Sie eine EMR Studio-Dienstrolle und Erstellen Sie eine EMR Studio-Benutzerrolle für den IAM Identity Center-Authentifizierungsmodus.

    Wenn Sie die IAMIdentity Center-Authentifizierung (früher AWS Single Sign On) für das Studio verwenden, können Sie die Anmeldung für Benutzer mit der Option Weitergabe vertrauenswürdiger Identitäten aktivieren optimieren. Mit Trusted Identity Propagation können sich Benutzer mit ihren Identity Center-Anmeldeinformationen anmelden und ihre Identitäten an nachgelagerte AWS Dienste weitergeben lassen, wenn sie das Studio verwenden.

    Im Abschnitt Application access (Anwendungszugriff) können Sie auch angeben, ob alle Benutzer und Gruppen in Ihrem Identity Center Zugriff auf das Studio haben sollen oder ob nur zugewiesene Benutzer und Gruppen, die Sie auswählen, auf das Studio zugreifen können.

    Weitere Informationen finden Sie unter Integrieren Sie Amazon EMR mit AWS IAM Identity Center und auch Weitergabe vertrauenswürdiger Identitäten über Anwendungen hinweg im AWS IAMIdentity Center-Benutzerhandbuch.

  8. Wählen Sie für VPC eine Amazon Virtual Private Cloud (VPC) für das Studio aus der Drop-down-Liste aus.

  9. Wählen Sie unter Subnetze maximal fünf Subnetze aus, die Sie dem Studio VPC zuordnen möchten. Sie haben die Möglichkeit, weitere Subnetze hinzuzufügen, nachdem Sie das Studio erstellt haben.

  10. Wählen Sie für Sicherheitsgruppen entweder die Standardsicherheitsgruppen oder benutzerdefinierte Sicherheitsgruppen aus. Weitere Informationen finden Sie unter Definieren Sie Sicherheitsgruppen zur Steuerung des EMR Studio-Netzwerkverkehrs.

    Wenn Sie folgendes auswählen … Vorgehensweise
    Die Standard-Sicherheitsgruppen von EMR Studio

    Um die Git-basierte Repository-Verknüpfung für das Studio zu aktivieren, wählen Sie Cluster/Endpunkte und Git-Repository aktivieren. Wählen Sie andernfalls Cluster/Endpunkte aktivieren.

    Benutzerdefinierte Sicherheitsgruppen für Ihr Studio
    • Wählen Sie unter Cluster-/Endpunktsicherheitsgruppe die Engine-Sicherheitsgruppe aus, die Sie aus der Dropdownliste konfiguriert haben. Ihr Studio verwendet diese Sicherheitsgruppe, um eingehenden Zugriff von verbundenen Workspaces aus zu ermöglichen.

    • Wählen Sie unter Workspace-Sicherheitsgruppe die Workspace-Sicherheitsgruppe aus, die Sie aus der Dropdownliste konfiguriert haben. Ihr Studio verwendet diese Sicherheitsgruppe mit Workspaces, um ausgehenden Zugriff auf verbundene EMR Amazon-Cluster und öffentlich gehostete Git-Repositorys zu ermöglichen.

  11. Fügen Sie Ihrem Studio und anderen Ressourcen Tags hinzu. Weitere Informationen zu Tags finden Sie unter Tag-Cluster.

  12. Wählen Sie Create Studio und starten Sie Workspace, um den Vorgang abzuschließen und zur Studios-Seite zu navigieren. Ihr neues Studio wird in der Liste mit Details wie Studio-Name, Erstellungsdatum und Studio-Zugriff angezeigtURL.

Nachdem Sie ein Studio erstellt haben, folgen Sie den Anweisungen unter Weisen Sie einem EMR Studio einen Benutzer oder eine Gruppe zu.

CLI
Anmerkung

Linux-Zeilenfortsetzungszeichen (\) sind aus Gründen der Lesbarkeit enthalten. Sie können entfernt oder in Linux-Befehlen verwendet werden. Entfernen Sie sie unter Windows oder ersetzen Sie sie durch ein Caret-Zeichen (^).

Beispiel — Erstellen Sie ein EMR Studio, das IAM zur Authentifizierung verwendet wird

Der folgende AWS CLI Beispielbefehl erstellt ein EMR Studio mit IAM Authentifizierungsmodus. Wenn Sie die IAM Authentifizierung oder den Verbund für das Studio verwenden, geben Sie keinen an--user-role.

Damit sich Verbundbenutzer mit Studio URL und den Anmeldeinformationen für Ihren Identitätsanbieter (IdP) anmelden können, geben Sie Ihr --idp-auth-url und an. --idp-relay-state-parameter-name Eine Liste der IdP-Authentifizierung URLs und der RelayState Namen finden Sie unter RelayState Parameter und Authentifizierung des Identitätsanbieters URLs.

aws emr create-studio \ --name <example-studio-name> \ --auth-mode IAM \ --vpc-id <example-vpc-id> \ --subnet-ids <subnet-id-1> <subnet-id-2>... <subnet-id-5> \ --service-role <example-studio-service-role-name> \ --user-role studio-user-role-name \ --workspace-security-group-id <example-workspace-sg-id> \ --engine-security-group-id <example-engine-sg-id> \ --default-s3-location <example-s3-location> \ --idp-auth-url <https://EXAMPLE/login/> \ --idp-relay-state-parameter-name <example-RelayState>
Beispiel — Erstellen Sie ein EMR Studio, das Identity Center für die Authentifizierung verwendet

Mit dem folgenden AWS CLI Beispielbefehl wird ein EMR Studio erstellt, das den IAM Identity Center-Authentifizierungsmodus verwendet. Wenn Sie die IAM Identity Center-Authentifizierung verwenden, müssen Sie einen angeben--user-role.

Weitere Informationen zum IAM Identity Center-Authentifizierungsmodus finden Sie unterIAMIdentity Center-Authentifizierungsmodus für Amazon EMR Studio einrichten.

aws emr create-studio \ --name <example-studio-name> \ --auth-mode SSO \ --vpc-id <example-vpc-id> \ --subnet-ids <subnet-id-1> <subnet-id-2>... <subnet-id-5> \ --service-role <example-studio-service-role-name> \ --user-role <example-studio-user-role-name> \ --workspace-security-group-id <example-workspace-sg-id> \ --engine-security-group-id <example-engine-sg-id> \ --default-s3-location <example-s3-location> --trusted-identity-propagation-enabled \ --idc-user-assignment OPTIONAL \ --idc-instance-arn <iam-identity-center-instance-arn>
Beispiel — CLI Ausgabe für aws emr create-studio

Es folgt ein Beispiel für die Ausgabe, die nach dem Erstellen eines Studios erscheint.

{ StudioId: "es-123XXXXXXXXX", Url: "https://es-123XXXXXXXXX.emrstudio-prod.us-east-1.amazonaws.com" }

Weitere Informationen über den Befehl create-studio finden Sie unter AWS CLI -Befehlsreferenz.

RelayState Parameter und Authentifizierung des Identitätsanbieters URLs

Wenn Sie den IAM Verbund verwenden und möchten, dass sich Benutzer mit Ihrem Studio URL und den Anmeldeinformationen für Ihren Identity Provider (IdP) anmelden, können Sie den Anmeldenamen URL und den RelayStateParameternamen Ihres Identity Providers (IdP) angeben, wenn Sie Erstellen Sie ein Studio EMR

Die folgende Tabelle zeigt die Standardauthentifizierung URL und den RelayState Parameternamen für einige beliebte Identitätsanbieter.

Identitätsanbieter Parameter Authentifizierung URL
Auth0 RelayState https://<sub_domain>.auth0.com/samlp/<app_id>
Google-Konten RelayState https://accounts.google.com/o/saml2/initsso?idpid=<idp_id>&spid=<sp_id>&forceauthn=false
Microsoft Azure RelayState https://myapps.microsoft.com/signin/<app_name>/<app_id>?tenantId=<tenant_id>
Okta RelayState https://<sub_domain>.okta.com/app/<app_name>/<app_id>/sso/saml
PingFederate TargetResource https://<host>/idp/<idp_id>/startSSO.ping?PartnerSpId=<sp_id>
PingOne TargetResource https://sso.connect.pingidentity.com/sso/sp/initsso?saasid=<app_id>&idpid=<idp_id>