Eine DataZone Amazon-Datenquelle für Amazon Redshift erstellen und ausführen - Amazon DataZone

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Eine DataZone Amazon-Datenquelle für Amazon Redshift erstellen und ausführen

In Amazon können Sie eine Amazon Redshift-Datenquelle erstellen DataZone, um technische Metadaten von Datenbanktabellen und Ansichten aus dem Amazon Redshift Data Warehouse zu importieren. Um eine DataZone Amazon-Datenquelle für Amazon Redshift hinzuzufügen, muss das Quell-Data Warehouse bereits in Amazon Redshift vorhanden sein.

Wenn Sie eine Amazon Redshift Redshift-Datenquelle erstellen und ausführen, fügen Sie dem Inventar Ihres DataZone Amazon-Projekts Assets aus dem Amazon Redshift Redshift-Quell-Data Warehouse hinzu. Sie können Ihre Amazon Redshift Redshift-Datenquellen nach einem festgelegten Zeitplan oder bei Bedarf ausführen, um die technischen Metadaten Ihrer Assets zu erstellen oder zu aktualisieren. Während der Datenquellenläufe können Sie sich optional dafür entscheiden, Ihre Projektinventarressourcen im DataZone Amazon-Katalog zu veröffentlichen und sie so für alle Domain-Benutzer auffindbar zu machen. Sie können Ihre Inventarressourcen auch veröffentlichen, nachdem Sie deren Geschäftsmetadaten bearbeitet haben. Domain-Benutzer können nach Ihren veröffentlichten Assets suchen und diese entdecken und Abonnements für diese Assets beantragen.

So fügen Sie eine Amazon Redshift Redshift-Datenquelle hinzu
  1. Navigieren Sie zur URL des DataZone Amazon-Datenportals und melden Sie sich mit Single Sign-On (SSO) oder Ihren AWS Anmeldeinformationen an. Wenn Sie ein DataZone Amazon-Administrator sind, können Sie unter https://console.aws.amazon.com/datazone zur DataZone Amazon-Konsole navigieren und sich dort anmelden, AWS-Konto wo die Domain erstellt wurde, und dann Datenportal öffnen wählen.

  2. Wählen Sie im oberen Navigationsbereich die Option Projekt auswählen und wählen Sie das Projekt aus, zu dem Sie die Datenquelle hinzufügen möchten.

  3. Navigieren Sie zur Registerkarte Daten für das Projekt.

  4. Wählen Sie im linken Navigationsbereich Datenquellen und dann Datenquelle erstellen aus.

  5. Konfigurieren Sie die folgenden Felder:

    • Name — Der Name der Datenquelle.

    • Beschreibung — Die Beschreibung der Datenquelle.

  6. Wählen Sie unter Datenquellentyp die Option Amazon Redshift aus.

  7. Geben Sie unter Umgebung auswählen eine Umgebung an, in der die Amazon Redshift Redshift-Tabellen veröffentlicht werden sollen.

  8. Abhängig von der ausgewählten Umgebung wendet Amazon DataZone automatisch die Amazon Redshift Redshift-Anmeldeinformationen und andere Parameter direkt aus der Umgebung an oder gibt Ihnen die Möglichkeit, Ihre eigenen auszuwählen.

    • Wenn Sie eine Umgebung ausgewählt haben, die nur das Veröffentlichen aus dem Amazon Redshift Redshift-Standardschema der Umgebung erlaubt, wendet Amazon DataZone automatisch die Amazon Redshift Redshift-Anmeldeinformationen und andere Parameter an, darunter den Namen des Amazon Redshift Redshift-Clusters oder der Arbeitsgruppe, den AWS geheimen Schlüssel, den Datenbanknamen und den Schemanamen. Sie können diese automatisch ausgefüllten Parameter nicht bearbeiten.

    • Wenn Sie eine Umgebung auswählen, in der keine Daten veröffentlicht werden können, können Sie nicht mit der Erstellung der Datenquelle fortfahren.

    • Wenn Sie eine Umgebung auswählen, die das Veröffentlichen von Daten aus einem beliebigen Schema ermöglicht, sehen Sie die Option, entweder die Anmeldeinformationen und andere Amazon Redshift Redshift-Parameter aus der Umgebung zu verwenden oder Ihre eigenen Anmeldeinformationen/Parameter einzugeben.

  9. Wenn Sie Ihre eigenen Anmeldeinformationen verwenden möchten, um die Datenquelle zu erstellen, geben Sie die folgenden Details an:

    • Wählen Sie unter Amazon Redshift-Anmeldeinformationen bereitstellen aus, ob Sie einen bereitgestellten Amazon Redshift Redshift-Cluster oder einen Amazon Redshift Serverless Workspace als Datenquelle verwenden möchten.

    • Wählen Sie je nach Ihrer Auswahl im obigen Schritt Ihren Amazon Redshift Redshift-Cluster oder Workspace aus dem Drop-down-Menü aus und wählen Sie dann das Geheimnis in AWS Secrets Manager aus, das für die Authentifizierung verwendet werden soll. Sie können ein vorhandenes Geheimnis auswählen oder ein neues erstellen.

    • Damit das vorhandene Geheimnis in der Drop-down-Liste angezeigt wird, stellen Sie sicher, dass Ihr Geheimnis in AWS Secrets Manager die folgenden Tags (Schlüssel/Wert) enthält:

      • AmazonDataZoneProject: <projectID>

      • AmazonDataZoneDomain: <domainID>

      Wenn Sie sich dafür entscheiden, ein neues Geheimnis zu erstellen, wird das Geheimnis automatisch mit den oben genannten Tags versehen, sodass keine zusätzlichen Schritte erforderlich sind. Weitere Informationen finden Sie unter Speichern von Datenbankanmeldedaten in AWS Secrets Manager.

      Amazon Redshift Redshift-Benutzer, die sich in dem für die Erstellung der Datenquelle angegebenen AWS Secret befinden, müssen über SELECT Berechtigungen für die Tabellen verfügen, die veröffentlicht werden sollen. Wenn Sie möchten DataZone , dass Amazon auch die Abonnements (den Zugriff) in Ihrem Namen verwaltet, müssen die Datenbankbenutzer in The AWS Secret außerdem über die folgenden Berechtigungen verfügen:

      • CREATE DATASHARE

      • ALTER DATASHARE

      • DROP DATASHARE

  10. Geben Sie unter Datenauswahl eine Amazon Redshift Redshift-Datenbank und ein Schema an und geben Sie Ihre Auswahlkriterien für Tabelle oder Ansicht ein. Wenn Sie beispielsweise Include wählen und Enter eingeben*corporate, enthält das Asset alle Quelltabellen, die mit dem Wort corporate enden.

    Sie können mehrere Include-Regeln für Tabellen innerhalb einer einzigen Datenbank hinzufügen. Sie können auch mehrere Datenbanken hinzufügen, indem Sie auf die Schaltfläche Weitere Datenbank hinzufügen klicken.

  11. Wählen Sie Weiter aus.

  12. Wählen Sie unter Veröffentlichungseinstellungen aus, ob Assets im Datenkatalog sofort auffindbar sind. Wenn Sie sie nur zum Inventar hinzufügen, können Sie später Abonnementbedingungen auswählen und sie im Geschäftsdatenkatalog veröffentlichen. Weitere Informationen finden Sie unter Bestehende DataZone Amazon-Datenquellen verwalten.

  13. Wählen Sie unter Automatisierte Generierung von Unternehmensnamen aus, ob Metadaten für Assets automatisch generiert werden sollen, sobald diese veröffentlicht und anhand der Quelle aktualisiert werden.

  14. (Optional) Fügen Sie für Metadaten-Formulare Formulare hinzu, um die Metadaten zu definieren, die gesammelt und gespeichert werden, wenn die Assets in Amazon importiert werden DataZone. Weitere Informationen finden Sie unter Metadatenformulare erstellen, bearbeiten oder löschen.

  15. Wählen Sie unter Einstellung „Ausführen“ aus, wann die Datenquelle ausgeführt werden soll.

    • Nach einem Zeitplan ausführen — Geben Sie Datum und Uhrzeit für die Ausführung der Datenquelle an.

    • Bei Bedarf ausführen — Sie können Datenquellenläufe manuell starten.

  16. Wählen Sie Weiter aus.

  17. Überprüfen Sie Ihre Datenquellenkonfiguration und wählen Sie Erstellen aus.

Anmerkung

Wenn eine Amazon Redshift Redshift-Datenquelle erstellt wird, DataZone gewährt Amazon nur Lesezugriff auf die Umgebung, in der die Datenquelle erstellt wurde, um auf alle Tabellen in den in der Datenquelle verwendeten Amazon Redshift Redshift-Schemas zuzugreifen. Sie können den Status dieser Zuschüsse unter Datenquellen auf der Detailseite Ihrer Umgebung überwachen.

Wenn Sie einen anderen Amazon Redshift Redshift-Cluster oder eine serverlose Arbeitsgruppe als die verwenden, mit der die Umgebung erstellt wurde, müssen Sie sicherstellen, dass das folgende AWS Tag dem Cluster oder der Arbeitsgruppe hinzugefügt wird. Dies ist erforderlich, damit die Benutzer der Umgebung die gewährte Datenbank im Amazon Redshift Query Editor V2 anzeigen können: DataZoneDiscoverable_${domainId}: true

In Umgebungen, die vor der aktuellen Version von Amazon erstellt wurden DataZone, können Projektmitglieder die gewährten Tabellen in Amazon Redshift nicht sehen.