Crear un nodo de origen de Amazon Redshift - AWS Glue

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Crear un nodo de origen de Amazon Redshift

Permisos necesarios

los trabajos de AWS Glue Studio que utilizan orígenes de datos de Amazon Redshift requieren permisos adicionales. Para obtener más información sobre cómo agregar permisos a los trabajos de ETL, consulte Revisar los permisos de IAM necesarios para los trabajos de ETL.

Se necesitan los siguientes permisos para utilizar una conexión de Amazon Redshift.

  • redshift-data:ListSchemas

  • redshift-data:ListTables

  • redshift-data:DescribeTable

  • redshift-data:ExecuteStatement

  • redshift-data:DescribeStatement

  • redshift-data:GetStatementResult

Agregar un origen de datos de Amazon Redshift

Para agregar un nodo de Origen de datos: Amazon Redshift:
  1. Elija el tipo de acceso a Amazon Redshift:

    • Conexión de datos directa (recomendada): elija esta opción si desea acceder a sus datos de Amazon Redshift directamente. Esta es la opción recomendada y también la predeterminada.

    • Data Catalog tables— Elija esta opción si hay tablas del catálogo de datos que desee utilizar.

  2. Si elige Conexión de datos directa, elija la conexión para el origen de datos de Amazon Redshift. Esto supone que la conexión ya existe y que puede seleccionar entre las conexiones existentes. Si necesita crear una conexión, elija Crear conexión de Redshift. Para más información, consulte Información general sobre el uso de conectores y conexiones.

    Una vez que haya elegido una conexión, puede ver las propiedades de la conexión mediante un clic en Ver propiedades. La información sobre la conexión está visible, como la URL, los grupos de seguridad, la subred, la zona de disponibilidad, la descripción y las marcas horarias creadas (UTC) y actualizadas por última vez (UTC).

  3. Elija una opción de origen de Amazon Redshift:

    • Elija una sola tabla: esta es la tabla que contiene los datos a los que desea acceder desde una sola tabla de Amazon Redshift.

    • Ingresar una consulta personalizada: permite acceder a un conjunto de datos de varias tablas de Amazon Redshift en función del consulta personalizada.

  4. Si eligió una sola tabla, elija el esquema de Amazon Redshift. La lista de esquemas disponibles para elegir se determina por la tabla seleccionada.

    O bien, elija Ingresar consulta personalizada. Elija esta opción para acceder a un conjunto de datos personalizado desde varias tablas de Amazon Redshift. Al elegir esta opción, ingrese la consulta de Amazon Redshift.

    Al conectarse a un entorno de Amazon Redshift sin servidor, agregue el siguiente permiso a la consulta personalizada:

    GRANT SELECT ON ALL TABLES IN <schema> TO PUBLIC

    Puede elegir Deducir el esquema para leer el esquema en función de la consulta que haya introducido. También puede elegir el editor de consultas Open Redshift para ingresar una consulta de Amazon Redshift. Para obtener más información, vea Consulta de una base de datos mediante el editor de consultas.

  5. En Rendimiento y seguridad, elija el directorio provisional de Amazon S3 y el rol de IAM.

    • Directorio de almacenamiento provisional de Amazon S3: elija la ubicación de Amazon S3 para almacenar los datos temporalmente.

    • Rol de IAM: elija la función de IAM que pueda escribir en la ubicación de Amazon S3 que haya seleccionado.

  6. En Parámetros de Redshift personalizados (opcional), ingrese el parámetro y el valor.