(Optional) Migrieren Sie Datenflüsse aus Data Wrangler in Studio Classic - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

(Optional) Migrieren Sie Datenflüsse aus Data Wrangler in Studio Classic

Wichtig

Derzeit ist der Import von Datenflussdateien in Data Wrangler in SageMaker Canvas nur in folgenden Fällen live möglich: AWS-Regionen

  • USA Ost (Nord-Virginia)

  • USA Ost (Ohio)

  • USA West (Oregon)

Wenn Sie Amazon SageMaker Data Wrangler zuvor in Amazon SageMaker Studio Classic für Datenvorbereitungsaufgaben verwendet haben, können Sie auf das neue Amazon SageMaker Studio migrieren und auf die neueste Version von Data Wrangler in Amazon Canvas zugreifen. SageMaker Data Wrangler in SageMaker Canvas bietet Ihnen eine verbesserte Benutzererfahrung und Zugriff auf die neuesten Funktionen, wie z. B. eine Benutzeroberfläche in natürlicher Sprache und eine schnellere Leistung.

Sie können SageMaker Canvas jederzeit nutzen, um mit der Nutzung des neuen Data Wrangler-Erlebnisses zu beginnen. Weitere Informationen finden Sie unter Erste Schritte mit der Verwendung von Amazon SageMaker Canvas.

Wenn Sie Datenflussdateien in Studio Classic gespeichert haben, an denen Sie zuvor gearbeitet haben, können Sie sie in Studio integrieren und die Flow-Dateien dann in Canvas importieren. In der folgenden Anleitung wird beschrieben, wie Sie Ihre Datenflussdateien migrieren. Von Studio Classic aus können Sie die Dateien entweder nach Amazon S3 exportieren oder auf Ihren lokalen Computer herunterladen. Anschließend melden Sie sich bei der SageMaker Canvas-Anwendung an, importieren die Flow-Dateien und setzen Ihre Datenvorbereitungsaufgaben fort.

Voraussetzungen

Überprüfen Sie die folgenden Voraussetzungen, bevor Sie mit der Migration Ihrer Flow-Dateien beginnen.

Schritt 1. Migrieren Sie die Domain und gewähren Sie Berechtigungen

Bevor Sie Datenflussdateien migrieren, müssen Sie bestimmte Schritte des Migration von Amazon SageMaker Studio Classic Handbuchs befolgen, um sicherzustellen, dass die AWS IAM-Ausführungsrolle Ihres Benutzerprofils über die erforderlichen Berechtigungen verfügt. Folgen Sie den Voraussetzungen und Phase 1: Migrieren Sie die Benutzeroberfläche von Studio Classic zu Studio bevor Sie fortfahren, in denen beschrieben wird, wie Sie die erforderlichen Berechtigungen erteilen, Studio als neues Erlebnis konfigurieren und Ihre bestehende Domain migrieren.

Insbesondere benötigen Sie die erforderlichen Berechtigungen, um eine SageMaker Canvas-Anwendung zu erstellen und die SageMaker Canvas-Datenvorbereitungsfunktionen zu verwenden. Um diese Berechtigungen zu erhalten, können Sie entweder:

Stellen Sie sicher, dass Sie dasselbe Benutzerprofil für Studio und Canvas verwenden. SageMaker

Nachdem Sie die im Migrationsleitfaden beschriebenen Voraussetzungen erfüllt haben, sollten Sie über eine neue Domain mit den erforderlichen Berechtigungen für den Zugriff auf SageMaker Canvas über Studio verfügen.

Schritt 2. (Optional) Bereiten Sie einen Amazon S3 S3-Standort vor

Wenn Sie Amazon S3 für die Übertragung Ihrer Flow-Dateien verwenden möchten, anstatt die lokale Download-Option zu verwenden, sollten Sie einen Amazon S3 S3-Bucket in Ihrem Konto haben, den Sie zum Speichern der Flow-Dateien verwenden möchten.

Exportieren Sie die Flow-Dateien aus Studio Classic

Anmerkung

Wenn Sie Ihre Studio Classic-Daten bereits zu Amazon S3 migriert haben, indem Sie den Anweisungen unter gefolgt sindPhase 3: (Optional) Daten von Studio Classic zu Studio migrieren, können Sie diesen Schritt überspringen und direkt zu dem Importieren Sie die Flow-Dateien in Canvas Abschnitt gehen, in dem Sie Ihre Flow-Dateien vom Amazon S3 S3-Speicherort importieren, an dem Ihre Studio Classic-Daten gespeichert sind.

Sie können Ihre Flow-Dateien exportieren, indem Sie sie entweder in Amazon S3 speichern oder auf Ihren lokalen Computer herunterladen. Wenn Sie im nächsten Schritt Ihre Flow-Dateien in SageMaker Canvas importieren und die lokale Upload-Option wählen, können Sie nur 20 Flow-Dateien gleichzeitig hochladen. Wenn Sie eine große Anzahl von Flow-Dateien importieren müssen, empfehlen wir Ihnen, stattdessen Amazon S3 zu verwenden.

Folgen Sie den Anweisungen unter entweder Methode 1: Verwenden Sie Amazon S3, um Flow-Dateien zu übertragen oderMethode 2: Verwenden Sie Ihren lokalen Computer, um Flow-Dateien zu übertragen, um fortzufahren.

Methode 1: Verwenden Sie Amazon S3, um Flow-Dateien zu übertragen

Mit dieser Methode verwenden Sie Amazon S3 als Vermittler zwischen Data Wrangler in Studio Classic und Data Wrangler in SageMaker Canvas (Zugriff über die neueste Version von Studio). Sie exportieren die Flow-Dateien von Studio Classic nach Amazon S3 und greifen dann im nächsten Schritt über Studio auf Canvas zu und importieren die Flow-Dateien aus Amazon S3.

Stellen Sie sicher, dass Sie einen Amazon S3 S3-Bucket als Speicherort für die Flow-Dateien vorbereitet haben.

Gehen Sie wie folgt vor, um Ihre Flow-Dateien von Studio Classic nach Amazon S3 zu exportieren:

  1. Öffnen Sie Studio Classic.

  2. Öffnen Sie ein neues Terminal, indem Sie wie folgt vorgehen:

    1. Wählen Sie in der oberen Navigationsleiste Datei.

    2. Zeigen Sie im Kontextmenü mit der Maus auf Neu und wählen Sie dann Terminal aus.

  3. Standardmäßig sollte das Terminal in Ihrem Home-Verzeichnis geöffnet werden. Navigieren Sie zu dem Ordner, der alle Flow-Dateien enthält, die Sie migrieren möchten.

  4. Verwenden Sie den folgenden Befehl, um alle Flow-Dateien mit dem angegebenen Amazon S3 S3-Speicherort zu synchronisieren. Ersetzen Sie {bucket-name} und {folder} durch den Pfad zu Ihrem gewünschten Amazon S3 S3-Standort. Weitere Informationen zu dem Befehl und den Parametern finden Sie unter dem Befehl sync in der AWS AWS CLI Befehlsreferenz.

    aws s3 sync . s3://{bucket-name}/{folder}/ --exclude "*.*" --include "*.flow"

    Wenn Sie Ihren eigenen Befehl verwenden AWS KMS key, verwenden Sie stattdessen den folgenden Befehl, um die Dateien zu synchronisieren, und geben Sie Ihre KMS-Schlüssel-ID an. Stellen Sie sicher, dass die IAM-Ausführungsrolle des Benutzers (bei der es sich um dieselbe Rolle handeln sollte, die in Schritt 1 verwendet wurde). Die Domäne migrieren und die oben genannten Berechtigungen gewähren (Voraussetzungen) wurde der Zugriff zur Verwendung des KMS-Schlüssels gewährt.

    aws s3 sync . s3://{bucket-name}/{folder}/ --exclude "*.*" --include "*.flow" --sse-kms-key-id {your-key-id}

Ihre Flow-Dateien sollten jetzt exportiert werden. Sie können Ihren Amazon S3 S3-Bucket überprüfen, um sicherzustellen, dass die Flow-Dateien erfolgreich synchronisiert wurden.

Um diese Dateien in die neueste Version von Data Wrangler zu importieren, folgen Sie den Schritten unter. Importieren Sie die Flow-Dateien in Canvas

Methode 2: Verwenden Sie Ihren lokalen Computer, um Flow-Dateien zu übertragen

Mit dieser Methode laden Sie die Flow-Dateien von Studio Classic auf Ihren lokalen Computer herunter. Sie können die Dateien direkt herunterladen oder sie als ZIP-Archiv komprimieren. Anschließend entpacken Sie die ZIP-Datei lokal (falls zutreffend), melden sich bei Canvas an und importieren die Flow-Dateien, indem Sie sie von Ihrem lokalen Computer hochladen.

Gehen Sie wie folgt vor, um Ihre Flow-Dateien von Studio Classic herunterzuladen:

  1. Öffnen Sie Studio Classic.

  2. (Optional) Wenn Sie mehrere Flow-Dateien in ein ZIP-Archiv komprimieren und alle auf einmal herunterladen möchten, gehen Sie wie folgt vor:

    1. Wählen Sie in der oberen Navigationsleiste von Studio Classic die Option Datei aus.

    2. Zeigen Sie im Kontextmenü mit der Maus auf Neu und wählen Sie dann Terminal aus.

    3. Standardmäßig wird das Terminal in Ihrem Home-Verzeichnis geöffnet. Navigieren Sie zu dem Ordner, der alle Flow-Dateien enthält, die Sie migrieren möchten.

    4. Verwenden Sie den folgenden Befehl, um die Flow-Dateien im aktuellen Verzeichnis als ZIP-Datei zu packen. Der Befehl schließt alle versteckten Dateien aus:

      find . -not -path "*/.*" -name "*.flow" -print0 | xargs -0 zip my_archive.zip
  3. Laden Sie das ZIP-Archiv oder einzelne Flow-Dateien wie folgt auf Ihren lokalen Computer herunter:

    1. Wählen Sie im linken Navigationsbereich von Studio Classic die Option Dateibrowser aus.

    2. Suchen Sie im Dateibrowser nach der Datei, die Sie herunterladen möchten.

    3. Klicken Sie mit der rechten Maustaste auf die Datei und wählen Sie im Kontextmenü die Option Herunterladen aus.

Die Datei sollte auf Ihren lokalen Computer heruntergeladen werden. Wenn Sie sie als ZIP-Archiv gepackt haben, extrahieren Sie die Dateien lokal. Gehen Sie nach dem Extrahieren der Dateien wie unter beschrieben vor, um diese Dateien in die neueste Version von Data Wrangler zu importieren. Importieren Sie die Flow-Dateien in Canvas

Importieren Sie die Flow-Dateien in Canvas

Nachdem Sie Ihre Flow-Dateien exportiert haben, greifen Sie über Studio auf Canvas zu und importieren Sie die Dateien.

Gehen Sie wie folgt vor, um Flow-Dateien in Canvas zu importieren:

  1. Öffnen Sie Ihre neueste Version von Studio.

  2. Wählen Sie in Studio im Bedienfeld „Anwendungen“ die Option „Canvas“.

  3. Wählen Sie auf der Seite Canvas die Option „Canvas ausführen“. Wenn Sie die Berechtigungen erfolgreich eingerichtet haben, wird eine Canvas-Anwendung für Sie erstellt. Es kann einige Minuten dauern, bis die Canvas-Anwendung fertig ist.

  4. Wenn Canvas bereit ist, wählen Sie Open Canvas.

  5. Wählen Sie im linken Navigationsbereich von Canvas Data Wrangler aus.

  6. Wählen Sie im oberen Bereich Datenflüsse importieren aus.

  7. Wählen Sie als Datenquelle entweder Amazon S3 oder Lokaler Upload aus.

  8. Wählen Sie Ihre Flow-Dateien aus Ihrem Amazon S3 S3-Bucket aus oder laden Sie die Dateien von Ihrem lokalen Computer hoch.

    Anmerkung

    Für den lokalen Upload können Sie maximal 20 Flow-Dateien gleichzeitig hochladen. Verwenden Sie für größere Importe Amazon S3. Wenn Sie einen Ordner für den Import auswählen, werden alle Flow-Dateien in Unterordnern ebenfalls importiert.

  9. Wählen Sie Daten importieren.

Wenn der Import erfolgreich war, erhalten Sie eine Benachrichtigung, dass die X Anzahl der Flow-Dateien erfolgreich importiert wurde.

Falls Ihre Flow-Dateien nicht erfolgreich importiert werden können, erhalten Sie in der SageMaker Canvas-Anwendung eine Benachrichtigung. Wählen Sie in der Benachrichtigung die Option Fehler anzeigen aus, um in den einzelnen Fehlermeldungen nach Anleitungen zur Neuformatierung falsch formatierter Flow-Dateien zu suchen.

Nachdem Ihre Flow-Dateien importiert wurden, rufen Sie die Data Wrangler-Seite der SageMaker Canvas-Anwendung auf, um Ihre Datenflüsse anzusehen. Sie können versuchen, einen Datenfluss zu öffnen, um zu überprüfen, ob er wie erwartet aussieht.