Erstellen eines Amazon Redshift-Quellknotens - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen eines Amazon Redshift-Quellknotens

Berechtigungen erforderlich

AWS Glue Studio-Aufträge, die Amazon Redshift-Datenquellen verwenden, erfordern zusätzliche Berechtigungen. Weitere Informationen zum Hinzufügen von Berechtigungen zu ETL-Aufträgen finden Sie unter Überprüfen der für ETL-Aufträge erforderlichen IAM-Berechtigungen.

Für die Nutzung einer Amazon Redshift-Verbindung sind die folgenden Berechtigungen erforderlich.

  • redshift-data:ListSchemas

  • redshift-data:ListTables

  • redshift-data:DescribeTable

  • redshift-data:ExecuteStatement

  • redshift-data:DescribeStatement

  • redshift-data:GetStatementResult

Hinzufügen einer Amazon Redshift-Datenquelle

So fügen Sie einen Knoten von Datenquelle – Amazon Redshift hinzu:
  1. Wählen Sie den Amazon Redshift-Zugriffstyp aus:

    • Direkte Datenverbindung (empfohlen) – wählen Sie diese Option, wenn Sie direkt auf Ihre Amazon Redshift-Daten zugreifen möchten. Dies ist die empfohlene Option und auch die Standardeinstellung.

    • Data Catalog tables – Wählen Sie diese Option, wenn Sie Data-Catalog-Tabellen verwenden möchten.

  2. Wenn Sie Direkte Datenverbindung wählen, wählen Sie die Verbindung für Ihre Amazon Redshift-Datenquelle. Dabei wird davon ausgegangen, dass die Verbindung bereits besteht und Sie aus bestehenden Verbindungen auswählen können. Wenn Sie eine Verbindung erstellen müssen, wählen Sie Redshift-Verbindung erstellen. Weitere Informationen finden Sie unter Übersicht über die Verwendung von Konnektoren und Verbindungen.

    Nachdem Sie eine Verbindung ausgewählt haben, können Sie die Verbindungseigenschaften anzeigen, indem Sie auf Eigenschaften anzeigen klicken. Informationen zur Verbindung sind sichtbar, einschließlich URL, Sicherheitsgruppen, Subnetz, Verfügbarkeitszone, Beschreibung sowie erstellte (UTC) und letzte aktualisierte (UTC) Zeitstempel.

  3. Wählen Sie eine Amazon Redshift-Quelloption aus:

    • Eine einzelne Tabelle auswählen – dies ist die Tabelle, die die Daten enthält, auf die Sie aus einer einzelnen Amazon Redshift-Tabelle zugreifen möchten.

    • Benutzerdefinierte Abfrage eingeben – ermöglicht Ihnen den Zugriff auf einen Datensatz aus mehreren Amazon Redshift-Tabellen basierend auf Ihrer benutzerdefinierten Abfrage.

  4. Wenn Sie eine einzelne Tabelle ausgewählt haben, wählen Sie das Amazon Redshift-Schema aus. Die Liste der verfügbaren Schemas zur Auswahl wird durch die ausgewählte Tabelle bestimmt.

    Oder wählen Sie Benutzerdefinierte Abfrage eingeben aus. Wählen Sie diese Option, um aus mehreren Amazon Redshift-Tabellen auf einen benutzerdefinierten Datensatz zuzugreifen. Wenn Sie diese Option auswählen, geben Sie die Amazon Redshift-Abfrage ein.

    Wenn Sie eine Verbindung zu einer Amazon Redshift-Serverless-Umgebung herstellen, fügen Sie der benutzerdefinierten Abfrage die folgende Berechtigung hinzu:

    GRANT SELECT ON ALL TABLES IN <schema> TO PUBLIC

    Sie können Schema ableiten auswählen, um das Schema basierend auf der von Ihnen eingegebenen Abfrage zu lesen. Sie können auch Redshift-Abfrage-Editor öffnen wählen, um eine Amazon Redshift-Abfrage einzugeben. Weitere Informationen finden Sie unter Abfragen einer Datenbank mit dem Abfrage-Editor.

  5. Wählen Sie unter Leistung und Sicherheit das Amazon-S3-Staging-Verzeichnis und die IAM-Rolle aus.

    • Amazon-S3-Staging-Verzeichnis – Wählen Sie den Amazon-S3-Speicherort für die temporäre Bereitstellung von Daten.

    • IAM-Rolle – Wählen Sie die IAM-Rolle aus, die an den von Ihnen ausgewählten Amazon-S3-Speicherort schreiben kann.

  6. Geben Sie unter Benutzerdefinierte Redshift-Parameter – optional den Parameter und den Wert ein.