DataZone Amazon-Schnellstart mit Amazon Redshift-Daten - Amazon DataZone

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

DataZone Amazon-Schnellstart mit Amazon Redshift-Daten

Führen Sie die folgenden Schnellstartschritte aus, um die vollständigen Workflows für Datenproduzenten und Datenverbraucher in Amazon anhand von Amazon DataZone Redshift Redshift-Beispieldaten durchzugehen.

Schritt 1 — DataZone Amazon-Domain und Datenportal erstellen

Gehen Sie wie folgt vor, um eine DataZone Amazon-Domain zu erstellen. Weitere Informationen zu DataZone Amazon-Domains finden Sie unter DataZone Amazon-Terminologie und Konzepte.

  1. Navigieren Sie unter https://console.aws.amazon.com/datazone zur DataZone Amazon-Konsole, melden Sie sich an und wählen Sie dann Create domain aus.

    Anmerkung

    Wenn Sie eine bestehende DataZone Amazon-Domain für diesen Workflow verwenden möchten, wählen Sie Domains anzeigen, wählen Sie dann die Domain aus, die Sie verwenden möchten, und fahren Sie dann mit Schritt 2 der Erstellung eines Veröffentlichungsprojekts fort.

  2. Geben Sie auf der Seite „Domain erstellen“ Werte für die folgenden Felder ein:

    • Name — geben Sie einen Namen für Ihre Domain an. Für die Zwecke dieses Workflows können Sie diese Domain aufrufenMarketing.

    • Beschreibung — Geben Sie eine optionale Domänenbeschreibung an.

    • Datenverschlüsselung — Ihre Daten werden standardmäßig mit einem Schlüssel verschlüsselt, der Ihnen AWS gehört und der für Sie verwaltet wird. Für diese exemplarische Vorgehensweise können Sie die Standardeinstellungen für die Datenverschlüsselung beibehalten.

      Weitere Informationen zur Verwendung von vom Kunden verwalteten Schlüsseln finden Sie unterDatenverschlüsselung im Ruhezustand für Amazon DataZone. Wenn Sie Ihren eigenen KMS Schlüssel für die Datenverschlüsselung verwenden, müssen Sie die folgende Anweisung in Ihre Standardeinstellung aufnehmenAmazonDataZoneDomainExecutionRole.

      { "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "kms:Decrypt", "kms:GenerateDataKey" ], "Resource": "*" } ] }
    • Dienstzugriff — Wählen Sie die Option Benutzerdefinierte Servicerolle verwenden und wählen Sie dann im Dropdownmenü die AmazonDataZoneDomainExecutionRoleaus.

    • Wählen Sie unter Schnelleinrichtung die Option Dieses Konto für Datenverbrauch und -veröffentlichung einrichten aus. Diese Option aktiviert die integrierten DataZone Amazon-Blueprints von Data Lake und Data Warehouse und konfiguriert die erforderlichen Berechtigungen und Ressourcen, um die restlichen Schritte in diesem Workflow abzuschließen. Weitere Informationen zu Amazon DataZone Blueprints finden Sie unter DataZone Amazon-Terminologie und Konzepte.

    • Lassen Sie die übrigen Felder unter „Berechtigungsdetails“ und „Tags“ unverändert und wählen Sie dann „Domain erstellen“.

  3. Sobald die Domain erfolgreich erstellt wurde, wählen Sie diese Domain aus und notieren Sie sich auf der Übersichtsseite der Domain das Datenportal URL für diese Domain. Sie können URL damit auf Ihr DataZone Amazon-Datenportal zugreifen, um die restlichen Schritte in diesem Workflow abzuschließen.

Anmerkung

In der aktuellen Version von Amazon DataZone kann die für das Datenportal URL generierte Domain nach der Erstellung nicht mehr geändert werden.

Die Erstellung der Domain kann mehrere Minuten dauern. Warten Sie, bis die Domain den Status Verfügbar hat, bevor Sie mit dem nächsten Schritt fortfahren.

Schritt 2 — Erstellen Sie das Veröffentlichungsprojekt

Im folgenden Abschnitt werden die Schritte zum Erstellen des Veröffentlichungsprojekts in diesem Workflow beschrieben.

  1. Sobald Sie Schritt 1 abgeschlossen haben, navigieren Sie über das DataZone Datenportal zum Amazon-Datenportal URL und melden Sie sich mit Ihrem Single Sign-On (SSO) oder Ihren AWS IAM Anmeldeinformationen an.

  2. Wählen Sie „Projekt erstellen“, geben Sie den Projektnamen an. Für diesen Workflow können Sie ihn beispielsweise benennen SalesDataPublishingProject, die restlichen Felder unverändert lassen und dann „Erstellen“ wählen.

Schritt 3 — Erstellen Sie die Umgebung

Im folgenden Abschnitt werden die Schritte zum Erstellen einer Umgebung in diesem Workflow beschrieben.

  1. Nachdem Sie Schritt 2 abgeschlossen haben, wählen Sie im DataZone Amazon-Datenportal das SalesDataPublishingProject Projekt aus, das Sie im vorherigen Schritt erstellt haben, wählen Sie dann die Registerkarte Umgebungen und dann Umgebung erstellen aus.

  2. Geben Sie auf der Seite Umgebung erstellen Folgendes an und wählen Sie dann Umgebung erstellen aus.

    • Name — geben Sie den Namen für die Umgebung an. Für diese exemplarische Vorgehensweise können Sie ihn Default data warehouse environment aufrufen.

    • Beschreibung — Geben Sie eine Beschreibung für die Umgebung an.

    • Umgebungsprofil — wählen Sie das DataWarehouseProfileUmgebungsprofil aus.

    • Geben Sie den Namen Ihres Amazon Redshift Redshift-Clusters, den Datenbanknamen und das Geheimnis ARN für den Amazon Redshift Redshift-Cluster an, in dem Ihre Daten gespeichert sind.

      Anmerkung

      Stellen Sie sicher, dass Ihr Secret in AWS Secrets Manager die folgenden Tags (Schlüssel/Wert) enthält:

      • Für Amazon Redshift Redshift-Cluster — datazone.rs.cluster: <cluster_name:database name>

        Für Amazon Redshift Serverless Workgroup — datazone.rs.workgroup: <workgroup_name:database_name>

      • AmazonDataZoneProject: <projectID>

      • AmazonDataZoneDomain: <domainID>

      Weitere Informationen finden Sie unter Speichern von Datenbankanmeldedaten in AWS Secrets Manager.

      Der Datenbankbenutzer, den Sie im AWS Secrets Manager angeben, muss Superuser-Rechte haben.

Schritt 4 — Daten für die Veröffentlichung erstellen

Im folgenden Abschnitt werden die Schritte zur Erstellung von Daten für die Veröffentlichung in diesem Workflow beschrieben.

  1. Nachdem Sie Schritt 3 abgeschlossen haben, wählen Sie im DataZone Amazon-Datenportal das SalesDataPublishingProject Projekt aus und wählen Sie dann im rechten Bereich unter Analytics-Tools Amazon Redshift aus. Dadurch wird der Amazon Redshift Redshift-Abfrage-Editor geöffnet, der die Anmeldeinformationen Ihres Projekts zur Authentifizierung verwendet.

  2. In dieser exemplarischen Vorgehensweise verwenden Sie das Abfrageskript „Tabelle als Select (CTAS) erstellen“, um eine neue Tabelle zu erstellen, die Sie auf Amazon DataZone veröffentlichen möchten. Führen Sie dieses CTAS Skript in Ihrem Abfrage-Editor aus, um eine mkt_sls_table Tabelle zu erstellen, die Sie veröffentlichen und für die Suche und das Abonnement zur Verfügung stellen können.

    CREATE TABLE mkt_sls_table AS SELECT 146776932 AS ord_num, 23 AS sales_qty_sld, 23.4 AS wholesale_cost, 45.0 as lst_pr, 43.0 as sell_pr, 2.0 as disnt, 12 as ship_mode,13 as warehouse_id, 23 as item_id, 34 as ctlg_page, 232 as ship_cust_id, 4556 as bill_cust_id UNION ALL SELECT 46776931, 24, 24.4, 46, 44, 1, 14, 15, 24, 35, 222, 4551 UNION ALL SELECT 46777394, 42, 43.4, 60, 50, 10, 30, 20, 27, 43, 241, 4565 UNION ALL SELECT 46777831, 33, 40.4, 51, 46, 15, 16, 26, 33, 40, 234, 4563 UNION ALL SELECT 46779160, 29, 26.4, 50, 61, 8, 31, 15, 36, 40, 242, 4562 UNION ALL SELECT 46778595, 43, 28.4, 49, 47, 7, 28, 22, 27, 43, 224, 4555 UNION ALL SELECT 46779482, 34, 33.4, 64, 44, 10, 17, 27, 43, 52, 222, 4556 UNION ALL SELECT 46779650, 39, 37.4, 51, 62, 13, 31, 25, 31, 52, 224, 4551 UNION ALL SELECT 46780524, 33, 40.4, 60, 53, 18, 32, 31, 31, 39, 232, 4563 UNION ALL SELECT 46780634, 39, 35.4, 46, 44, 16, 33, 19, 31, 52, 242, 4557 UNION ALL SELECT 46781887, 24, 30.4, 54, 62, 13, 18, 29, 24, 52, 223, 4561

    Stellen Sie sicher, dass die Tabelle mkt_sls_table erfolgreich erstellt wurde. Jetzt haben Sie ein Datenobjekt, das im DataZone Amazon-Katalog veröffentlicht werden kann.

Schritt 5 — Metadaten aus Amazon Redshift sammeln

Im folgenden Abschnitt werden die Schritte zum Sammeln von Metadaten aus Amazon Redshift beschrieben.

  1. Nachdem Sie Schritt 4 abgeschlossen haben, wählen Sie im DataZone Amazon-Datenportal das SalesDataPublishingProject Projekt, dann die Registerkarte Daten und dann Datenquellen aus.

  2. Wählen Sie die Quelle aus, die im Rahmen der Erstellung der Umgebung erstellt wurde.

  3. Wählen Sie neben dem Dropdownmenü „Aktion“ die Option „Ausführen“ und klicken Sie dann auf die Schaltfläche „Aktualisieren“. Sobald der Datenquellenlauf abgeschlossen ist, werden die Assets dem DataZone Amazon-Inventar hinzugefügt.

Schritt 6 — Kuratieren und veröffentlichen Sie das Datenobjekt

Im folgenden Abschnitt werden die Schritte zum Kuratieren und Veröffentlichen des Datenbestands in diesem Workflow beschrieben.

  1. Nachdem Sie Schritt 5 abgeschlossen haben, wählen Sie im DataZone Amazon-Datenportal das SalesDataPublishingProject Projekt aus, wählen Sie dann die Registerkarte Daten, wählen Sie Inventardaten aus und suchen Sie die mkt_sls_table Tabelle.

  2. Öffnen Sie die Seite mit den mkt_sls_table Asset-Details, um die automatisch generierten Unternehmensnamen zu sehen. Wählen Sie das Symbol Automatisch generierte Metadaten, um die automatisch generierten Namen für Assets und Spalten anzuzeigen. Sie können entweder jeden Namen einzeln akzeptieren oder ablehnen oder Alle akzeptieren wählen, um die generierten Namen zu übernehmen. Optional können Sie Ihrem Asset auch das verfügbare Metadatenformular hinzufügen und Glossarbegriffe auswählen, um Ihre Daten zu klassifizieren.

  3. Wählen Sie Veröffentlichen, um das Asset zu veröffentlichen. mkt_sls_table

Schritt 7 — Erstellen Sie das Projekt für die Datenanalyse

Im folgenden Abschnitt werden die Schritte zum Erstellen des Projekts für die Datenanalyse in diesem Workflow beschrieben.

  1. Nachdem Sie Schritt 6 abgeschlossen haben, wählen Sie im DataZone Amazon-Datenportal die Option Projekt erstellen aus.

  2. Geben Sie auf der Seite Projekt erstellen den Projektnamen an, z. B. für diesen Workflow. Sie können ihm einen Namen geben MarketingDataAnalysisProject, dann die restlichen Felder unverändert lassen und dann Create wählen.

Schritt 8 — Erstellen Sie eine Umgebung für die Datenanalyse

Im folgenden Abschnitt werden die Schritte zum Erstellen einer Umgebung für die Datenanalyse in diesem Workflow beschrieben.

  1. Nachdem Sie Schritt 7 abgeschlossen haben, wählen Sie im DataZone Amazon-Datenportal das MarketingDataAnalysisProject Projekt aus, das Sie im vorherigen Schritt erstellt haben, wählen Sie dann die Registerkarte Umgebungen und dann Umgebung hinzufügen.

  2. Geben Sie auf der Seite Umgebung erstellen Folgendes an und wählen Sie dann Umgebung erstellen aus.

    • Name — geben Sie den Namen für die Umgebung an. Für diese exemplarische Vorgehensweise können Sie ihn Default data warehouse environment aufrufen.

    • Beschreibung — Geben Sie eine Beschreibung für die Umgebung an.

    • Umgebungsprofil — wählen Sie ein DataWarehouseProfileUmgebungsprofil.

    • Geben Sie den Namen Ihres Amazon Redshift Redshift-Clusters, den Datenbanknamen und das Geheimnis ARN für den Amazon Redshift Redshift-Cluster an, in dem Ihre Daten gespeichert sind.

      Anmerkung

      Stellen Sie sicher, dass Ihr Secret in AWS Secrets Manager die folgenden Tags (Schlüssel/Wert) enthält:

      • Für Amazon Redshift Redshift-Cluster — datazone.rs.cluster: <cluster_name:database name>

        Für Amazon Redshift Serverless Workgroup — datazone.rs.workgroup: <workgroup_name:database_name>

      • AmazonDataZoneProject: <projectID>

      • AmazonDataZoneDomain: <domainID>

      Weitere Informationen finden Sie unter Speichern von Datenbankanmeldedaten in AWS Secrets Manager.

      Der Datenbankbenutzer, den Sie im AWS Secrets Manager angeben, muss Superuser-Rechte haben.

    • Lassen Sie für diese exemplarische Vorgehensweise die restlichen Felder unverändert.

Schritt 9: Durchsuchen Sie den Datenkatalog und abonnieren Sie Daten

Im folgenden Abschnitt werden die Schritte zum Durchsuchen des Datenkatalogs und zum Abonnieren von Daten beschrieben.

  1. Nachdem Sie Schritt 8 abgeschlossen haben, suchen Sie im DataZone Amazon-Datenportal mithilfe von Schlüsselwörtern (z. B. „Katalog“ oder „Verkauf“) in der Suchleiste des Datenportals nach Datenbeständen.

    Wenden Sie bei Bedarf Filter oder Sortierungen an. Sobald Sie das Asset mit den Produktverkaufsdaten gefunden haben, können Sie es auswählen, um die Detailseite des Assets zu öffnen.

  2. Wählen Sie auf der Detailseite des Assets „Produktverkaufsdaten“ die Option Abonnieren aus.

  3. Wählen Sie im Dialogfeld Ihr Verbraucherprojekt aus der Dropdownliste aus, geben Sie den Grund für die Zugriffsanfrage an und wählen Sie dann Abonnieren aus.

Schritt 10 — Genehmigen Sie die Abonnementanfrage

Im folgenden Abschnitt werden die Schritte zur Genehmigung der Abonnementanfrage in diesem Workflow beschrieben.

  1. Nachdem Sie Schritt 9 abgeschlossen haben, wählen Sie im DataZone Amazon-Datenportal das SalesDataPublishingProjectProjekt aus, mit dem Sie Ihr Asset veröffentlicht haben.

  2. Wählen Sie die Registerkarte Daten, dann Veröffentlichte Daten und dann Eingehende Anfragen.

  3. Wählen Sie den Link „Anfrage anzeigen“ und dann „Genehmigen“.

Schritt 11 — Erstellen Sie eine Abfrage und analysieren Sie Daten in Amazon Redshift

Nachdem Sie ein Asset erfolgreich im DataZone Amazon-Katalog veröffentlicht und abonniert haben, können Sie es analysieren.

  1. Klicken Sie im DataZone Amazon-Datenportal im rechten Bereich auf den Link Amazon Redshift. Dadurch wird der Amazon Redshift Redshift-Abfrage-Editor geöffnet, der die Anmeldeinformationen des Projekts zur Authentifizierung verwendet.

  2. Sie können jetzt eine Abfrage (Select-Anweisung) für die abonnierte Tabelle ausführen. Sie können auf die Tabelle klicken (three-vertical-dots Option) und „Vorschau“ wählen, damit die ausgewählte Anweisung auf dem Editor-Bildschirm angezeigt wird. Führen Sie die Abfrage aus, um die Ergebnisse zu sehen.