Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Établissez l'accès et les autorisations pour les référentiels Git
EMRStudio prend en charge les services Git suivants :
Pour permettre aux utilisateurs de EMR Studio d'associer un référentiel Git à un espace de travail, définissez les exigences d'accès et d'autorisation suivantes. Vous pouvez également configurer des référentiels Git que vous hébergez sur un réseau privé en suivant les instructions de Configuration d'un dépôt Git hébergé en privé pour EMR Studio.
- Accès Internet en cluster
-
Les EMR clusters Amazon exécutés sur Amazon EC2 et Amazon EMR sur des EKS clusters attachés à Studio Workspaces doivent se trouver dans un sous-réseau privé utilisant une passerelle de traduction d'adresses réseau (NAT), ou ils doivent pouvoir accéder à Internet via une passerelle privée virtuelle. Pour de plus amples informations, veuillez consulter VPCOptions Amazon lorsque vous lancez un cluster.
Les groupes de sécurité que vous utilisez avec EMR Studio doivent également inclure une règle sortante qui autorise Workspaces à acheminer le trafic vers Internet à partir d'un cluster rattachéEMR. Pour de plus amples informations, veuillez consulter Définissez des groupes de sécurité pour contrôler le trafic réseau de EMR Studio.
Important
Si l'interface réseau se trouve dans un sous-réseau public, elle ne pourra pas communiquer avec Internet via une passerelle Internet (IGW).
- Autorisations pour AWS Secrets Manager
-
Pour permettre aux utilisateurs de EMR Studio d'accéder aux référentiels Git contenant des secrets stockés dans AWS Secrets Manager, ajoutez une politique d'autorisation au rôle de service pour EMR Studio qui autorise l'
secretsmanager:GetSecretValue
opération.
Pour plus d'informations sur la façon de lier des référentiels Git à des Workspaces, consultez. Lier des référentiels basés sur Git à un espace de travail Studio EMR
Configuration d'un dépôt Git hébergé en privé pour EMR Studio
Suivez les instructions suivantes pour configurer des référentiels hébergés en privé pour Amazon EMR Studio. Fournissez un fichier de configuration contenant des informations sur vos serveurs DNS et ceux de Git. EMRStudio utilise ces informations pour configurer des espaces de travail qui peuvent acheminer le trafic vers vos référentiels autogérés.
Note
Si vous configurezDnsServerIpV4
, EMR Studio utilise votre DNS serveur pour résoudre à la fois votre point de terminaison GitServerDnsName
et celui de votre point de EMR terminaison Amazon, par exempleelasticmapreduce.us-east-1.amazonaws.com
. Pour configurer un point de terminaison pour AmazonEMR, connectez-vous à votre point de terminaison via VPC celui que vous utilisez avec votre Studio. Cela garantit que le point de EMR terminaison Amazon est résolu vers une adresse IP privée. Pour de plus amples informations, veuillez consulter Connectez-vous à Amazon à EMR l'aide d'un point de VPC terminaison d'interface.
Prérequis
Avant de configurer un dépôt Git hébergé en privé pour EMR Studio, vous avez besoin d'un emplacement de stockage Amazon S3 où EMR Studio peut sauvegarder les espaces de travail et les fichiers de bloc-notes qu'il contient. Utilisez le même compartiment S3 que celui que vous avez spécifié lorsque vous créez un studio.
Pour configurer un ou plusieurs référentiels Git hébergés en privé pour Studio EMR
-
Créez un fichier de configuration à l'aide du modèle suivant. Incluez les valeurs suivantes pour chaque serveur Git que vous souhaitez spécifier dans votre configuration :
-
DnsServerIpV4
- L'IPv4adresse de votre DNS serveur. Si vous fournissez des valeurs pour les deuxDnsServerIpV4
etGitServerIpV4List
, la valeur deDnsServerIpV4
est prioritaire et EMR Studio l'utiliseDnsServerIpV4
pour résoudre votreGitServerDnsName
problème.Note
Pour utiliser des référentiels Git hébergés en privé, votre DNS serveur doit autoriser l'accès entrant depuis EMR Studio. Nous vous conseillons vivement de protéger votre DNS serveur contre tout autre accès non autorisé.
-
GitServerDnsName
- Le DNS nom de votre serveur Git. Par exemple,"git.example.com"
. -
GitServerIpV4List
- Une liste d'IPv4adresses appartenant à vos serveurs Git.
[ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "
<10.24.34.xxx>
", "GitServerDnsName": "<enterprise.git.com>
", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>
", "<xxx.xxx.xxx.xxx>
" ] }, { "DnsServerIpV4": "<10.24.34.xxx>
", "GitServerDnsName": "<git.example.com>
", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>
", "<xxx.xxx.xxx.xxx>
" ] } ] } ] -
-
Enregistrez votre fichier de configuration sous
configuration.json
. -
Chargez le fichier de configuration dans l'emplacement de stockage Amazon S3 dans un dossier appelé
life-cycle-configuration
. Par exemple, si votre emplacement S3 par défaut ests3://
, votre fichier de configuration doit se trouver dansDOC-EXAMPLE-BUCKET
/studioss3://
.DOC-EXAMPLE-BUCKET
/studios/life-cycle-configuration/configuration.jsonImportant
Nous vous conseillons vivement de limiter l'accès à votre
life-cycle-configuration
dossier aux administrateurs de Studio et à votre rôle de service EMR Studio, et de vous protégerconfiguration.json
contre tout accès non autorisé. Pour des instructions, consultez la rubrique Contrôle de l'accès à un compartiment avec des politiques utilisateur ou Bonnes pratiques de sécurité pour Amazon S3.Pour des instructions sur le chargement, consultez les rubriques Création d'un dossier et Chargement d'objets dans le Guide de l'utilisateur d'Amazon Simple Storage Service. Pour appliquer votre configuration à un Workspace existant, fermez et redémarrez le Workspace après avoir chargé votre fichier de configuration sur Amazon S3.