Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Vorbereiten und Importieren von Massendaten mit Amazon SageMaker Data Wrangler
Wichtig
Wenn Sie Data Wrangler verwenden, entstehen SageMaker Ihnen Kosten. Eine vollständige Liste der Gebühren und Preise finden Sie auf der Registerkarte Data Wrangler in der SageMaker Amazon-Preisübersicht
Nachdem Sie eine Datensatzgruppe erstellt haben, können Sie Amazon SageMaker Data Wrangler (Data Wrangler) verwenden, um Daten aus mehr als 40 Quellen in einen Amazon Personalize-Datensatz zu importieren. Data Wrangler ist eine Funktion von Amazon SageMaker Studio Classic, die eine end-to-end Lösung zum Importieren, Vorbereiten, Transformieren und Analysieren von Daten bietet. Sie können Data Wrangler nicht verwenden, um Daten vorzubereiten und in einen Actions-Datensatz oder Action-Interaktions-Datensatz zu importieren.
Wenn Sie Data Wrangler zum Vorbereiten und Importieren von Daten verwenden, verwenden Sie einen Datenfluss. Ein Datenfluss definiert eine Reihe von Datenvorbereitungsschritten für maschinelles Lernen, beginnend mit dem Import von Daten. Jedes Mal, wenn Sie Ihrem Flow einen Schritt hinzufügen, ergreift Data Wrangler eine Aktion an Ihren Daten, z. B. transformiert sie oder generiert eine Visualisierung.
Im Folgenden sind einige der Schritte aufgeführt, die Sie zu Ihrem Schema hinzufügen können, um Daten für Amazon Personalize vorzubereiten:
-
Einblicke: Sie können Ihrem Flow spezifische Insight-Schritte von Amazon Personalize hinzufügen. Diese Erkenntnisse können Ihnen helfen, mehr über Ihre Daten zu erfahren und zu erfahren, welche Maßnahmen Sie ergreifen können, um sie zu verbessern.
-
Visualisierungen: Sie können Visualisierungsschritte hinzufügen, um Grafiken wie Histogramme und Streudiagramme zu erstellen. Mithilfe von Diagrammen können Sie Probleme in Ihren Daten erkennen, z. B. Ausreißer oder fehlende Werte.
-
Transformationen: Sie können spezifische und allgemeine Transformationsschritte von Amazon Personalize verwenden, um sicherzustellen, dass Ihre Daten die Anforderungen von Amazon Personalize erfüllen. Die Amazon Personalize Personalize-Transformation hilft Ihnen, Ihre Datenspalten je nach Amazon Personalize Personalize-Datensatztyp den erforderlichen Spalten zuzuordnen.
Wenn Sie Data Wrangler verlassen müssen, bevor Sie Daten in Amazon Personalize importieren, können Sie zu der Stelle zurückkehren, an der Sie aufgehört haben, indem Sie denselben Datensatztyp wählen, wenn Sie Data Wrangler von der Amazon Personalize Personalize-Konsole aus starten. Oder Sie können direkt über Studio Classic auf Data Wrangler zugreifen. SageMaker
Wir empfehlen Ihnen, Daten aus Data Wrangler wie folgt in Amazon Personalize zu importieren. Die Transformations-, Visualisierungs- und Analyseschritte sind optional, wiederholbar und können in beliebiger Reihenfolge ausgeführt werden.
-
Berechtigungen einrichten — Richten Sie Berechtigungen für Amazon Personalize und SageMaker Servicerollen ein. Und richten Sie Berechtigungen für Ihre Benutzer ein.
-
Data Wrangler in SageMaker Studio Classic von der Amazon Personalize Personalize-Konsole aus starten — Verwenden Sie die Amazon Personalize Personalize-Konsole, um eine SageMaker Domain zu konfigurieren und Data Wrangler in Studio Classic zu starten. SageMaker
-
Importieren Sie Ihre Daten in Data Wrangler — Importieren Sie Daten aus über 40 Quellen in Data Wrangler. Zu den Quellen gehören AWS Dienste wie Amazon RedshiftEMR, Amazon oder Amazon Athena und Drittanbieter wie Snowflake oder. DataBricks
-
Transformieren Sie Ihre Daten — Verwenden Sie Data Wrangler, um Ihre Daten so zu transformieren, dass sie die Anforderungen von Amazon Personalize erfüllen.
-
Visualisieren und analysieren Sie Ihre Daten — Verwenden Sie Data Wrangler, um Ihre Daten zu visualisieren und sie mithilfe von Amazon Personalize-spezifischen Erkenntnissen zu analysieren.
-
Daten verarbeiten und in Amazon Personalize importieren — Verwenden Sie ein SageMaker Studio Classic Jupyter-Notizbuch, um Ihre verarbeiteten Daten in Amazon Personalize zu importieren.
Zusätzliche Informationen
Die folgenden Ressourcen bieten zusätzliche Informationen zur Verwendung von Amazon SageMaker Data Wrangler und Amazon Personalize.
-
Ein Tutorial, das Sie durch die Verarbeitung und Transformation eines Beispieldatensatzes führt, finden Sie unter Demo: Data Wrangler Titanic Dataset Walkthrough im Amazon Developer Guide. SageMaker In diesem Tutorial werden die Felder und Funktionen von Data Wrangler vorgestellt.
-
Informationen zum Onboarding bei SageMaker Amazon-Domains finden Sie unter Schnelles Onboarding bei Amazon SageMaker Domain im Amazon SageMaker Developer Guide.
-
Informationen zu den Datenanforderungen von Amazon Personalize finden Sie unterVorbereiten von Trainingsdaten für Amazon Personalize.