Bereiten Sie ML-Daten mit Amazon vor SageMaker DATA Wrangler - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bereiten Sie ML-Daten mit Amazon vor SageMaker DATA Wrangler

Amazon SageMaker Data Wrangler (Data Wrangler) ist ein Feature von Amazon SageMaker Studio, das ein end-to-end Lösung zum Importieren, Vorbereiten, Transformieren, Featurisieren und Analysieren von Daten. Sie können einen Data Wrangler-Datenfluss in Ihre Workflows für maschinelles Lernen (ML) integrieren, um die Datenvorverarbeitung und das Feature-Engineering mit wenig bis gar keiner Codierung zu vereinfachen und zu rationalisieren. Sie können auch Ihre eigenen Python-Skripte und Transformationen hinzufügen, um Workflows anzupassen.

Data Wrangler bietet die folgenden Kernfunktionalitäten, mit denen Sie Daten für maschinelles Lernen analysieren und vorbereiten können.

  • Import- Connect Sie sich mit Amazon Simple Storage Service (Amazon S3) und importieren Sie sie von Amazon Simple Storage ServiceAmazon Athena(Athena) und Amazon Redshift.

  • Datenfluss— Erstellen Sie einen Datenfluss, um eine Reihe von ML-Datenvorbereitungsschritten zu definieren. Sie können einen Flow verwenden, um Datensätze aus verschiedenen Datenquellen zu kombinieren, die Anzahl und Typen von Transformationen zu identifizieren, die Sie auf Datasets anwenden möchten, und einen Datenvorbereitungs-Workflow definieren, der in eine ML-Pipeline integriert werden kann.

  • Transformation- Reinigen und transformieren Sie Ihren Datensatz mit Standardwandelt umwie Zeichenfolge-, Vektor- und numerische Datenformatierungswerkzeuge. Stellen Sie Ihre Daten mithilfe von Transformationen wie Text- und Datums-/Uhrzeit-Einbettung und kategorischer Kodierung bereit.

  • Analysieren— Analysieren Sie Funktionen in Ihrem Datensatz an jedem Punkt in Ihrem Flow. Data Wrangler umfasst integrierte Datenvisualisierungstools wie Scatterplots und Histogramme sowie Datenanalyse-Tools wie Zielleckage-Analyse und schnelle Modellierung, um die Feature-Korrelation zu verstehen.

  • Export— Data Wrangler bietet Exportoptionen in andere SageMaker Dienstleistungen, einschließlich Data Wrangler-Jobs, Amazon SageMaker Feature Store und Pipelines, mit denen Sie Ihren Datenvorbereitungsfluss in Ihren ML-Workflow integrieren können. Sie können Ihren Data Wrangler-Flow auch in Python-Code exportieren.

Informationen zum Einstieg in Data Wrangler finden Sie unterErste Schritte mit Data Wrangleraus.