Zugriff und Berechtigungen für Git-basierte Repositorys einrichten - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Zugriff und Berechtigungen für Git-basierte Repositorys einrichten

EMRStudio unterstützt die folgenden Git-basierten Dienste:

Damit EMR Studio-Benutzer ein Git-Repository mit einem Workspace verknüpfen können, richten Sie die folgenden Zugriffs- und Berechtigungsanforderungen ein. Sie können auch Git-basierte Repositorys konfigurieren, die Sie in einem privaten Netzwerk hosten, indem Sie den Anweisungen unter Ein privat gehostetes Git-Repository für EMR Studio konfigurieren folgen.

Cluster-Internetzugang

Sowohl EMR Amazon-Cluster, die auf Amazon EC2 ausgeführt werden, als auch Amazon EMR auf EKS Clustern, die an Studio Workspaces angeschlossen sind, müssen sich in einem privaten Subnetz befinden, das ein Network Address Translation (NAT) -Gateway verwendet, oder sie müssen über ein virtuelles privates Gateway auf das Internet zugreifen können. Weitere Informationen finden Sie unter VPCAmazon-Optionen beim Starten eines Clusters.

Die Sicherheitsgruppen, die Sie mit EMR Studio verwenden, müssen auch eine Regel für ausgehenden Datenverkehr enthalten, die es Workspaces ermöglicht, den Datenverkehr von einem angeschlossenen Cluster ins Internet weiterzuleiten. EMR Weitere Informationen finden Sie unter Definieren Sie Sicherheitsgruppen zur Steuerung des EMR Studio-Netzwerkverkehrs.

Wichtig

Wenn sich die Netzwerkschnittstelle in einem öffentlichen Subnetz befindet, kann sie nicht über ein Internet-Gateway () mit dem Internet kommunizieren. IGW

Berechtigungen für AWS Secrets Manager

Um EMR Studio-Benutzern den Zugriff auf Git-Repositorys zu ermöglichen, in denen Secrets gespeichert sind AWS Secrets Manager, fügen Sie der Servicerolle für EMR Studio eine Berechtigungsrichtlinie hinzu, die den secretsmanager:GetSecretValue Vorgang ermöglicht.

Informationen zum Verknüpfen von Git-basierten Repositorys mit Workspaces finden Sie unter Git-basierte Repositorys mit einem EMR Studio-Workspace verknüpfen.

Ein privat gehostetes Git-Repository für EMR Studio konfigurieren

Verwenden Sie die folgenden Anweisungen, um privat gehostete Repositorys für Amazon EMR Studio zu konfigurieren. Stellen Sie eine Konfigurationsdatei mit Informationen zu Ihren DNS und Git-Servern bereit. EMRStudio verwendet diese Informationen, um Workspaces zu konfigurieren, die den Datenverkehr an Ihre selbstverwalteten Repositorys weiterleiten können.

Anmerkung

Wenn Sie konfigurierenDnsServerIpV4, verwendet EMR Studio Ihren DNS Server, um GitServerDnsName sowohl Ihren als auch Ihren EMR Amazon-Endpunkt aufzulösen, z. elasticmapreduce.us-east-1.amazonaws.com B. Um einen Endpunkt für Amazon einzurichtenEMR, stellen Sie über den, den Sie mit Ihrem Studio verwendenVPC, eine Verbindung zu Ihrem Endpunkt her. Dadurch wird sichergestellt, dass der EMR Amazon-Endpunkt in eine private IP aufgelöst wird. Weitere Informationen finden Sie unter Stellen Sie EMR über einen VPC Schnittstellenendpunkt eine Connect zu Amazon her.

Voraussetzungen

Bevor Sie ein privat gehostetes Git-Repository für EMR Studio konfigurieren, benötigen Sie einen Amazon S3 S3-Speicherort, an dem EMR Studio die Workspaces und Notizbuchdateien im Studio sichern kann. Verwenden Sie denselben S3-Bucket, den Sie beim Erstellen eines Studios angegeben haben.

Um ein oder mehrere privat gehostete Git-Repositorys für EMR Studio zu konfigurieren
  1. Erstellen Sie eine Konfigurationsdatei mithilfe der folgenden Vorlage. Geben Sie für jeden Git-Server, den Sie in Ihrer Konfiguration angeben möchten, die folgenden Werte an:

    • DnsServerIpV4- Die IPv4 Adresse Ihres DNS Servers. Wenn Sie Werte für sowohl als auch DnsServerIpV4 angebenGitServerIpV4List, hat der Wert für DnsServerIpV4 Vorrang und EMR Studio verwendet, um Ihr GitServerDnsName Problem DnsServerIpV4 zu lösen.

      Anmerkung

      Um privat gehostete Git-Repositorys verwenden zu können, muss Ihr DNS Server eingehenden Zugriff von Studio aus EMR zulassen. Wir bitten Sie dringend, Ihren DNS Server vor anderen, unbefugten Zugriffen zu schützen.

    • GitServerDnsName- Der DNS Name Ihres Git-Servers. Zum Beispiel "git.example.com".

    • GitServerIpV4List- Eine Liste von IPv4 Adressen, die zu deinen Git-Servern gehören.

    [ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<enterprise.git.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] }, { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<git.example.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] } ] } ]
  2. Speichern Sie Ihre Konfigurationsdatei unter configuration.json.

  3. Laden Sie die Konfigurationsdatei in Ihren Amazon-S3-Speicherort in einem Ordner mit dem life-cycle-configuration-Namen hoch. Wenn Ihr Standard-S3-Speicherort beispielsweise s3://DOC-EXAMPLE-BUCKET/studios lautet, befindet sich Ihre Konfigurationsdatei in s3://DOC-EXAMPLE-BUCKET/studios/life-cycle-configuration/configuration.json.

    Wichtig

    Wir bitten Sie dringend, den Zugriff auf Ihren life-cycle-configuration Ordner auf Studio-Administratoren und Ihre EMR Studio-Servicerolle zu beschränken und sich configuration.json vor unbefugtem Zugriff zu schützen. Anweisungen finden Sie unter Steuern des Zugriffs auf einen Bucket mit Benutzerrichtlinien oder Bewährte Sicherheitsmethoden für Amazon S3.

    Anweisungen zum Hochladen finden Sie unter Erstellen eines Ordners und Hochladen von Objekten im Benutzerhandbuch für Amazon Simple Storage Service. Um Ihre Konfiguration auf einen vorhandenen Workspace anzuwenden, schließen Sie den Workspace und starten Sie ihn neu, nachdem Sie Ihre Konfigurationsdatei auf Amazon S3 hochgeladen haben.