Conexiones de AWS Glue - AWS Glue

Conexiones de AWS Glue

Una conexión de AWS Glue es un objeto del Data Catalog que almacena información de conexión para un almacén de datos determinado. Las conexiones almacenan credenciales de inicio de sesión, cadenas de URI, información de nube privada virtual (VPC), etc. Al crear conexiones en el Data Catalog se ahorra el esfuerzo de tener que especificar todos los detalles de conexión cada vez que se crea un rastreador o trabajo. Puede usar conexiones tanto para orígenes como para destinos.

Están disponibles los siguientes tipos de conexión:

  • JDBC

    • Amazon Redshift

    • Amazon Relational Database Service (Amazon RDS)

  • Amazon DocumentDB

  • DynamoDB

  • Kafka

  • Amazon Kinesis

  • MongoDB

  • Red [designa una conexión a un origen de datos dentro de un entorno de Amazon Virtual Private Cloud (Amazon VPC)]

  • Simple Storage Service (Amazon S3)

Con AWS Glue Studio, también puede crear conexiones para conectores personalizados o conectores que adquiera de AWS Marketplace. Para obtener más información, consulte Uso de conectores y conexiones con AWS Glue Studio

Cuando se crea un rastreador o un trabajo de extracción, transformación y carga (ETL) para cualquiera de estos orígenes de datos, se especifica la conexión que se va a utilizar. También puede especificar opcionalmente una conexión al crear un punto de enlace de desarrollo o escribir datos a un destino.

En general, no se requiere una conexión para los orígenes o destinos de Amazon Simple Storage Service (Amazon S3) que se encuentran en la Internet pública. Sin embargo, para obtener acceso a Amazon S3 desde su nube virtual privada (VPC), se requiere un punto de enlace de la VPC de Amazon S3 del tipo gateway. Para obtener más información, consulte Puntos de enlace de Amazon VPC para Amazon S3 .

Además, si desea obtener acceso a los orígenes de datos de Amazon S3 ubicados en la nube virtual privada (VPC), debe crear una conexión de tipo Network.

En la información de conexión, también debe tener en cuenta si se obtiene acceso a los datos a través de una VPC y, a continuación, configurar los parámetros de red en consecuencia. AWS Glue necesita una IP privada para los puntos de enlace JDBC. Las conexiones a bases de datos se pueden realizar a través de una VPN y AWS Direct Connect, ya que proporcionan acceso IP privado a bases de datos locales.

Para obtener información acerca de cómo conectarse a bases de datos locales, consulte Cómo acceder a almacenes de datos locales y analizarlos usando AWS Glue en el sitio web del blog de Big Data de AWS.