Definizione di accesso e autorizzazioni per i repository basati su Git - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Definizione di accesso e autorizzazioni per i repository basati su Git

EMRStudio supporta i seguenti servizi basati su Git:

Per consentire agli utenti di EMR Studio di associare un repository Git a un Workspace, imposta i seguenti requisiti di accesso e autorizzazioni. È inoltre possibile configurare i repository basati su Git ospitati in una rete privata seguendo le istruzioni riportate in Configurare un repository Git ospitato privatamente per Studio EMR.

Accesso a Internet del cluster

Sia EMR i cluster Amazon in esecuzione su Amazon EC2 che Amazon EMR sui EKS cluster collegati a Studio Workspaces devono trovarsi in una sottorete privata che utilizza un gateway di traduzione degli indirizzi di rete (NAT) oppure devono essere in grado di accedere a Internet tramite un gateway privato virtuale. Per ulteriori informazioni, consulta VPCOpzioni di Amazon all'avvio di un cluster.

I gruppi di sicurezza che usi con EMR Studio devono includere anche una regola in uscita che consenta a Workspaces di indirizzare il traffico verso Internet da un cluster collegato. EMR Per ulteriori informazioni, consulta Definisci gruppi di sicurezza per controllare il traffico di rete di Studio EMR.

Importante

Se l'interfaccia di rete si trova in una sottorete pubblica, non sarà in grado di comunicare con Internet tramite un gateway Internet (). IGW

Autorizzazioni per AWS Secrets Manager

Per consentire agli utenti di EMR Studio di accedere ai repository Git con segreti archiviati in AWS Secrets Manager, aggiungi una politica di autorizzazioni al ruolo di servizio per EMR Studio che ne consente l'secretsmanager:GetSecretValueoperazione.

Per ulteriori informazioni su come collegare repository basati su Git ai Workspace, consulta Collega i repository basati su Git a uno Studio Workspace EMR.

Configurare un repository Git ospitato privatamente per Studio EMR

Utilizza le seguenti istruzioni per configurare repository ospitati privatamente per Amazon EMR Studio. Fornisci un file di configurazione con informazioni sui tuoi server DNS e Git. EMRStudio utilizza queste informazioni per configurare aree di lavoro in grado di indirizzare il traffico verso i repository autogestiti.

Nota

Se configuriDnsServerIpV4, EMR Studio utilizza il tuo DNS server per risolvere sia il tuo GitServerDnsName endpoint che il tuo EMR endpoint Amazon, ad elasticmapreduce.us-east-1.amazonaws.com esempio. Per configurare un endpoint per AmazonEMR, connettiti al tuo endpoint tramite VPC quello che stai utilizzando con Studio. Ciò garantisce che l'EMRendpoint Amazon si risolva in un IP privato. Per ulteriori informazioni, consulta Connect ad Amazon EMR utilizzando un VPC endpoint di interfaccia.

Prerequisiti

Prima di configurare un repository Git ospitato privatamente per EMR Studio, è necessaria una posizione di storage Amazon S3 EMR in cui Studio possa eseguire il backup delle aree di lavoro e dei file dei notebook in Studio. Utilizza lo stesso bucket S3 specificato durante la creazione di uno Studio.

Per configurare uno o più repository Git ospitati privatamente per Studio EMR
  1. Crea un file di configurazione utilizzando il seguente modello. Includi i seguenti valori per ogni server Git che desideri specificare nella configurazione:

    • DnsServerIpV4- L'IPv4indirizzo del tuo DNS server. Se fornisci valori per entrambi DnsServerIpV4 eGitServerIpV4List, il valore di ha la DnsServerIpV4 precedenza e EMR Studio lo utilizza DnsServerIpV4 per risolvere i tuoiGitServerDnsName.

      Nota

      Per utilizzare repository Git ospitati privatamente, il DNS server deve consentire l'accesso in entrata da Studio. EMR Ti invitiamo a proteggere il tuo DNS server da altri accessi non autorizzati.

    • GitServerDnsName- Il DNS nome del tuo server Git. Ad esempio, "git.example.com".

    • GitServerIpV4List- Un elenco di IPv4 indirizzi che appartengono ai tuoi server Git.

    [ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<enterprise.git.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] }, { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<git.example.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] } ] } ]
  2. Salva il file di configurazione come configuration.json.

  3. Carica il file di configurazione nel percorso di archiviazione Amazon S3 in una cartella denominata life-cycle-configuration. Ad esempio, se la posizione S3 predefinita è s3://DOC-EXAMPLE-BUCKET/studios, il file di configurazione sarà in s3://DOC-EXAMPLE-BUCKET/studios/life-cycle-configuration/configuration.json.

    Importante

    Ti invitiamo a limitare l'accesso alla tua life-cycle-configuration cartella agli amministratori di Studio e al tuo ruolo di servizio di EMR Studio e a configuration.json proteggerti dagli accessi non autorizzati. Per ricevere istruzioni, consulta Controllo dell'accesso a un bucket con policy utente o Best practice di sicurezza per Amazon S3.

    Per istruzioni sul caricamento, consulta Creazione di una cartella e Caricamento degli oggetti nella Guida per l'utente di Amazon Simple Storage. Per applicare la configurazione a un Workspace esistente, chiudi e riavvia il Workspace dopo aver caricato il file di configurazione su Amazon S3.