Configuration de l'accès réseau aux magasins de données - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration de l'accès réseau aux magasins de données

Pour exécuter vos tâches d'extraction, de transformation et de chargement (ETL), AWS Glue doit être en mesure d'accéder à vos magasins de données. Si une tâche n'a pas besoin de s'exécuter dans le sous-réseau de votre Virtual Private Cloud (VPC), par exemple, si elle transforme les données d'Amazon S3 vers Amazon S3, aucune configuration supplémentaire n'est nécessaire.

Si une tâche doit s'exécuter dans votre sous-réseau VPC, par exemple, en transformant des données d'un magasin de données JDBC dans un sous-réseau privé, AWS Glue configure les interfaces réseau Elastic qui permettent à vos tâches de se connecter en toute sécurité à d'autres ressources au sein de votre VPC. À chaque interface réseau Elastic est affectée une adresse IP privée comprise dans la plage d'adresses IP du sous-réseau que vous avez spécifié. Aucune adresse IP publique n'est attribuée. Les groupes de sécurité spécifiés dans la connexion AWS Glue sont appliqués sur chacune des interfaces réseau Elastic. Pour de plus amples informations, veuillez consulter Configuration d'Amazon VPC pour les connexions JDBC aux magasins de données Amazon RDS à partir de AWS Glue.

Tous les magasins de données JDBC auxquels la tâche peut accéder doivent être disponibles à partir du sous-réseau du VPC. Pour accéder à Amazon S3 à partir de votre VPC, un point de terminaison d'un VPC est requis. Si votre tâche a besoin d'accéder aux ressources du VPC et au réseau Internet public, le VPC doit disposer d'une passerelle de traduction d'adresses réseau (NAT) dans le VPC.

Une tâche ou un point de terminaison de développement ne peut accéder qu'à un seul VPC (et sous-réseau) à la fois. Si vous avez besoin d'accéder à des magasins de données de différents VPC, vous disposez des options suivantes :

  • Utilisez l'appairage de VPC pour accéder aux magasins de données. Pour plus d'informations sur l'appairage de VPC, consultez Principes de base de l'appairage de VPC.

  • Utilisez un compartiment Amazon S3 comme emplacement de stockage intermédiaire. Fractionnez le travail en deux tâches, avec la sortie Amazon S3 de la tâche 1 comme entrée de la tâche 2.

Pour plus d'informations sur la façon de se connecter à un magasin de données Amazon Redshift à l'aide d'Amazon VPC, consultez Configuration des connexions Redshift.

Pour plus d'informations sur la façon de se connecter aux magasins de données Amazon RDS à l'aide d'Amazon VPC, consultez Configuration d'Amazon VPC pour les connexions JDBC aux magasins de données Amazon RDS à partir de AWS Glue.

Une fois les règles nécessaires définies dans Amazon VPC, vous créez une connexion dans AWS Glue avec les propriétés nécessaires pour vous connecter à vos magasins de données. Pour plus d'informations sur la connexion, consultez Connexion aux données.

Note

Veillez à configurer votre environnement DNS pour AWS Glue. Pour de plus amples informations, veuillez consulter Configuration du DNS de votre VPC.