Versionshinweise

Data Wrangler wird regelmäßig mit neuen Funktionen und Fehlerbehebungen aktualisiert. Um die Version von Data Wrangler, die Sie in Studio Classic verwenden, zu aktualisieren, folgen Sie den Anweisungen unter. Fahren Sie die Studio Classic-Apps herunter und aktualisieren Sie sie

Versionshinweise

Versionshinweise
31.8.2023 Neue Funktionalität: Sie können jetzt einen Datenqualitäts- und Insights-Bericht für Ihren gesamten Datensatz erstellen. Weitere Informationen finden Sie unter Erhalten Sie Einblicke in Daten und Datenqualität. 20.05.2023 Neue Funktionalität: Sie können jetzt Ihre Daten aus Salesforce Data Cloud importieren. Weitere Informationen finden Sie unter Daten aus Salesforce Data Cloud importieren. 18.4.2023 Neue Funktionalität: Sie können Ihre Daten jetzt in einem Format abrufen, das Amazon Personalize interpretieren kann. Weitere Informationen finden Sie unter Zuordnung von Spalten für Amazon Personalize. 1.3.2023 Neue Funktionalität: Sie können jetzt Hive verwenden, um Ihre Daten aus Amazon EMR zu importieren. Weitere Informationen finden Sie unter Daten aus Amazon EMR importieren. 12.10.2022 Neue Funktionalität: Sie können jetzt Ihren Data Wrangler-Flow zu einem Inferenzendpunkt exportieren. Weitere Informationen finden Sie unter Zu einem Inferenz-Endpunkt exportieren. Neue Funktionalität: Sie können jetzt ein interaktives Notebook-Widget für die Datenvorbereitung verwenden. Weitere Informationen finden Sie unter Verwenden Sie ein interaktives Datenvorbereitungs-Widget in einem Amazon SageMaker Studio Classic-Notizbuch, um Dateneinblicke zu erhalten. Neue Funktionalität: Sie können jetzt Daten von SaaS-Plattformen importieren. Weitere Informationen finden Sie unter Daten von SaaS-Plattformen (Software-as-a-Service) importieren. 12.10.2022 Neue Funktionalität: Sie können jetzt Datenflüsse für verschiedene Datensätze wiederverwenden. Weitere Informationen finden Sie unter Wiederverwenden von Datenabläufe für verschiedene Datensätze. 10.05.2022 Neue Funktionalität: Sie können jetzt die Principal Component Analysis (PCA) als Transformation verwenden. Weitere Informationen finden Sie unter Die Dimensionalität innerhalb eines Datensatzes reduzieren. 10.05.2022 Neue Funktionalität: Sie können jetzt Parameter in Ihrem Data Wrangler-Flow neu anpassen. Weitere Informationen finden Sie unter Export. 10.03.2022 Neue Funktionalität: Sie können jetzt Modelle aus Ihrem Data Wrangler-Flow bereitstellen. Weitere Informationen finden Sie unter Automatisches Schulen von Modellen auf Ihrem Datenfluss. 20.9.2022 Neue Funktionalität: Sie können jetzt Datenaufbewahrungsfristen in Athena festlegen. Weitere Informationen finden Sie unter Daten aus Athena importieren. 9.6.2022 Neue Funktionalität: Sie können jetzt Amazon SageMaker Autopilot verwenden, um ein Modell direkt aus Ihrem Data Wrangler-Flow heraus zu trainieren. Weitere Informationen finden Sie unter Automatisches Schulen von Modellen auf Ihrem Datenfluss. 06.05.2022 Neue Funktionalität: Sie können jetzt zusätzliche M5- und R5-Instances verwenden. Weitere Informationen finden Sie unter Instances. 27.4.2022 Neue Funktionalitäten: Sie können jetzt einen Datenqualitätsbericht erhalten. Weitere Informationen finden Sie unter Erhalten Sie Einblicke in Daten und Datenqualität. Sie können jetzt Zufallsstichproben und geschichtete Stichproben durchführen. Weitere Informationen finden Sie unter Sampling. 1.4.2022 Neue Funktionalität: Sie können jetzt Databricks als Datenquelle verwenden. Weitere Informationen finden Sie unter Daten aus Databricks importieren (JDBC). 2.2.2022 Neue Funktionalitäten: Sie können jetzt mithilfe von Zielknoten exportieren. Weitere Informationen finden Sie unter Export. Sie können ORC- und JSON-Dateien importieren. Weitere Informationen über Dateitypen finden Sie unter Import. Data Wrangler unterstützt jetzt die Verwendung der SMOTE-Transformation. Weitere Informationen finden Sie unter Daten ausgleichen. Data Wrangler unterstützt jetzt die Ähnlichkeitskodierung für kategoriale Daten. Weitere Informationen finden Sie unter Ähnlichkeitscodierung. Data Wrangler unterstützt jetzt das Entfernen von Verschachtelungen von JSON-Daten. Weitere Informationen finden Sie unter Verschachtelung von JSON-Daten aufheben. Data Wrangler unterstützt jetzt die Erweiterung der Werte eines Arrays in separate Spalten. Weitere Informationen finden Sie unter Array explodieren. Data Wrangler unterstützt jetzt, sich bei Problemen an das Serviceteam zu wenden. Weitere Informationen finden Sie unter Fehlerbehebung. Data Wrangler unterstützt das Bearbeiten und Löschen von Schritten in Ihrem Datenfluss. Weitere Informationen erhalten Sie unter Löschen Sie einen Schritt aus Ihrem Datenfluss und Bearbeiten Sie einen Schritt in Ihrem Data Wrangler-Fluss. Sie können jetzt Transformationen für mehrere Spalten durchführen. Weitere Informationen finden Sie unter Daten transformieren. Data Wrangler unterstützt jetzt Kostenzuordnungs-Tags. Weitere Informationen finden Sie unter Verwendung von Kostenzuordnungs-Tags. 16.10.2021 Neue Funktionalität: Data Wrangler unterstützt jetzt Athena-Arbeitsgruppen. Weitere Informationen finden Sie unter Daten aus Athena importieren. 6.10.2021 Neue Funktionalität: Data Wrangler unterstützt jetzt die Transformation von Zeitreihendaten. Weitere Informationen finden Sie unter Zeitreihen transformieren. 15.7.2021 Neue Funktionalitäten: Snowflake und Data Wrangler wird jetzt unterstützt. Sie können Snowflake als Datenquelle in Data Wrangler verwenden. Unterstützung für benutzerdefinierte Feldtrennzeichen in CSV hinzugefügt. Jetzt werden Komma, Doppelpunkt, Semikolon, Pipe (\|) und Tab unterstützt. Jetzt können Sie die Ergebnisse direkt in Amazon S3 exportieren. Es wurden einige neue Multikollinearitätsanalysatoren hinzugefügt: Varianzinflationsfaktoren, Hauptkomponentenanalyse und Lasso-Merkmalsauswahl. Verbesserungen: Die Analysediagramme können nicht mehr mit überlappenden Beschriftungen verpackt werden. Fehlerbehebungen: Der One-Hot-Encoder verarbeitet leere Zeichenketten problemlos. Es wurden Abstürze behoben, die auftraten, wenn der Name einer DataFrame-Spalte Punkte enthielt. 26.04.2021 Verbesserungen: Unterstützung für verteilte Verarbeitungsjobs hinzugefügt. Sie können mehrere Instances verwenden, wenn Sie einen Verarbeitungsauftrag ausführen. Der Data Wrangler Processing Job führt jetzt automatisch kleine Ausgaben zusammen, wenn die geschätzte Ergebnisgröße weniger als 1 Gigabyte beträgt. Feature Store Notebook: Verbesserte Leistung bei der Feature-Store-Aufnahme Data Wrangler Processing Jobs verwenden jetzt 1.x als autoritatives Container-Tag für future Versionen. Fehlerbehebungen: Renderprobleme für facettierte Histogramme wurden behoben. Fehler beim Export in einen Verarbeitungsjob behoben, um Spalten vom Typ Vektoren zu unterstützen. Der `Extract using regex` Operator, der die erste erfasste Gruppe zurückgibt, wenn eine oder mehrere Gruppen im regulären Ausdruck oder Regex vorhanden sind, wurde korrigiert. 8.2.2021 Neue Funktionalitäten: Data Wrangler Flows unterstützt mehrere Instances. Der Export nach Data Wrangler Job Notebook wurde aktualisiert, um SageMaker SDK 2.20.0 zu verwenden. Der Export nach Pipeline Notebook wurde aktualisiert, um SDK 2.20.0 zu verwenden. SageMaker Der Export nach Pipeline Notebook wurde aktualisiert, um ein XGBoost Schulungsbeispiel als optionalen Schritt hinzuzufügen. Verbesserungen: Um die Leistung zu verbessern, wird der Import von CSV-Dateien, die mehrere Zeilen in einem einzigen Feld enthalten, nicht mehr unterstützt. Fehlerbehebungen: Das Problem mit der Typinferenz im Schnellmodell wurde behoben. Der Fehler bei der Bias-Metrik in Bias-Berichten wurde behoben. Die Texttransformation Featurize wurde korrigiert, sodass sie jetzt mit Spalten mit fehlenden Werten funktioniert. Die integrierten Visualisierungen für Histogramm und Punktdiagramm wurden behoben, sodass sie nun auch mit Datensätzen funktionieren, die array-ähnliche Spalten enthalten. Die Athena-Abfrage wird jetzt erneut ausgeführt, wenn die Abfrageausführungs-ID abgelaufen ist.

31.8.2023

Neue Funktionalität:

Sie können jetzt einen Datenqualitäts- und Insights-Bericht für Ihren gesamten Datensatz erstellen. Weitere Informationen finden Sie unter Erhalten Sie Einblicke in Daten und Datenqualität.

20.05.2023

Neue Funktionalität:

Sie können jetzt Ihre Daten aus Salesforce Data Cloud importieren. Weitere Informationen finden Sie unter Daten aus Salesforce Data Cloud importieren.

18.4.2023

Neue Funktionalität:

Sie können Ihre Daten jetzt in einem Format abrufen, das Amazon Personalize interpretieren kann. Weitere Informationen finden Sie unter Zuordnung von Spalten für Amazon Personalize.

1.3.2023

Neue Funktionalität:

Sie können jetzt Hive verwenden, um Ihre Daten aus Amazon EMR zu importieren. Weitere Informationen finden Sie unter Daten aus Amazon EMR importieren.

12.10.2022

Neue Funktionalität:

Sie können jetzt Ihren Data Wrangler-Flow zu einem Inferenzendpunkt exportieren. Weitere Informationen finden Sie unter Zu einem Inferenz-Endpunkt exportieren.

Neue Funktionalität:

Sie können jetzt ein interaktives Notebook-Widget für die Datenvorbereitung verwenden. Weitere Informationen finden Sie unter Verwenden Sie ein interaktives Datenvorbereitungs-Widget in einem Amazon SageMaker Studio Classic-Notizbuch, um Dateneinblicke zu erhalten.

Neue Funktionalität:

Sie können jetzt Daten von SaaS-Plattformen importieren. Weitere Informationen finden Sie unter Daten von SaaS-Plattformen (Software-as-a-Service) importieren.

12.10.2022

Neue Funktionalität:

Sie können jetzt Datenflüsse für verschiedene Datensätze wiederverwenden. Weitere Informationen finden Sie unter Wiederverwenden von Datenabläufe für verschiedene Datensätze.

10.05.2022

Neue Funktionalität:

Sie können jetzt die Principal Component Analysis (PCA) als Transformation verwenden. Weitere Informationen finden Sie unter Die Dimensionalität innerhalb eines Datensatzes reduzieren.

10.05.2022

Neue Funktionalität:

Sie können jetzt Parameter in Ihrem Data Wrangler-Flow neu anpassen. Weitere Informationen finden Sie unter Export.

10.03.2022

Neue Funktionalität:

Sie können jetzt Modelle aus Ihrem Data Wrangler-Flow bereitstellen. Weitere Informationen finden Sie unter Automatisches Schulen von Modellen auf Ihrem Datenfluss.

20.9.2022

Neue Funktionalität:

Sie können jetzt Datenaufbewahrungsfristen in Athena festlegen. Weitere Informationen finden Sie unter Daten aus Athena importieren.

9.6.2022

Neue Funktionalität:

Sie können jetzt Amazon SageMaker Autopilot verwenden, um ein Modell direkt aus Ihrem Data Wrangler-Flow heraus zu trainieren. Weitere Informationen finden Sie unter Automatisches Schulen von Modellen auf Ihrem Datenfluss.

06.05.2022

Neue Funktionalität:

Sie können jetzt zusätzliche M5- und R5-Instances verwenden. Weitere Informationen finden Sie unter Instances.

27.4.2022

Neue Funktionalitäten:

Sie können jetzt einen Datenqualitätsbericht erhalten. Weitere Informationen finden Sie unter Erhalten Sie Einblicke in Daten und Datenqualität.
Sie können jetzt Zufallsstichproben und geschichtete Stichproben durchführen. Weitere Informationen finden Sie unter Sampling.

1.4.2022

Neue Funktionalität:

Sie können jetzt Databricks als Datenquelle verwenden. Weitere Informationen finden Sie unter Daten aus Databricks importieren (JDBC).

2.2.2022

Neue Funktionalitäten:

Sie können jetzt mithilfe von Zielknoten exportieren. Weitere Informationen finden Sie unter Export.
Sie können ORC- und JSON-Dateien importieren. Weitere Informationen über Dateitypen finden Sie unter Import.
Data Wrangler unterstützt jetzt die Verwendung der SMOTE-Transformation. Weitere Informationen finden Sie unter Daten ausgleichen.
Data Wrangler unterstützt jetzt die Ähnlichkeitskodierung für kategoriale Daten. Weitere Informationen finden Sie unter Ähnlichkeitscodierung.
Data Wrangler unterstützt jetzt das Entfernen von Verschachtelungen von JSON-Daten. Weitere Informationen finden Sie unter Verschachtelung von JSON-Daten aufheben.
Data Wrangler unterstützt jetzt die Erweiterung der Werte eines Arrays in separate Spalten. Weitere Informationen finden Sie unter Array explodieren.
Data Wrangler unterstützt jetzt, sich bei Problemen an das Serviceteam zu wenden. Weitere Informationen finden Sie unter Fehlerbehebung.
Data Wrangler unterstützt das Bearbeiten und Löschen von Schritten in Ihrem Datenfluss. Weitere Informationen erhalten Sie unter Löschen Sie einen Schritt aus Ihrem Datenfluss und Bearbeiten Sie einen Schritt in Ihrem Data Wrangler-Fluss.
Sie können jetzt Transformationen für mehrere Spalten durchführen. Weitere Informationen finden Sie unter Daten transformieren.
Data Wrangler unterstützt jetzt Kostenzuordnungs-Tags. Weitere Informationen finden Sie unter Verwendung von Kostenzuordnungs-Tags.

16.10.2021

Neue Funktionalität:

Data Wrangler unterstützt jetzt Athena-Arbeitsgruppen. Weitere Informationen finden Sie unter Daten aus Athena importieren.

6.10.2021

Neue Funktionalität:

Data Wrangler unterstützt jetzt die Transformation von Zeitreihendaten. Weitere Informationen finden Sie unter Zeitreihen transformieren.

15.7.2021

Neue Funktionalitäten:

Snowflake und Data Wrangler wird jetzt unterstützt. Sie können Snowflake als Datenquelle in Data Wrangler verwenden.
Unterstützung für benutzerdefinierte Feldtrennzeichen in CSV hinzugefügt. Jetzt werden Komma, Doppelpunkt, Semikolon, Pipe (|) und Tab unterstützt.
Jetzt können Sie die Ergebnisse direkt in Amazon S3 exportieren.
Es wurden einige neue Multikollinearitätsanalysatoren hinzugefügt: Varianzinflationsfaktoren, Hauptkomponentenanalyse und Lasso-Merkmalsauswahl.

Verbesserungen:

Die Analysediagramme können nicht mehr mit überlappenden Beschriftungen verpackt werden.

Fehlerbehebungen:

Der One-Hot-Encoder verarbeitet leere Zeichenketten problemlos.
Es wurden Abstürze behoben, die auftraten, wenn der Name einer DataFrame-Spalte Punkte enthielt.

26.04.2021

Verbesserungen:

Unterstützung für verteilte Verarbeitungsjobs hinzugefügt. Sie können mehrere Instances verwenden, wenn Sie einen Verarbeitungsauftrag ausführen.
Der Data Wrangler Processing Job führt jetzt automatisch kleine Ausgaben zusammen, wenn die geschätzte Ergebnisgröße weniger als 1 Gigabyte beträgt.
Feature Store Notebook: Verbesserte Leistung bei der Feature-Store-Aufnahme
Data Wrangler Processing Jobs verwenden jetzt 1.x als autoritatives Container-Tag für future Versionen.

Fehlerbehebungen:

Renderprobleme für facettierte Histogramme wurden behoben.
Fehler beim Export in einen Verarbeitungsjob behoben, um Spalten vom Typ Vektoren zu unterstützen.
Der Extract using regex Operator, der die erste erfasste Gruppe zurückgibt, wenn eine oder mehrere Gruppen im regulären Ausdruck oder Regex vorhanden sind, wurde korrigiert.

8.2.2021

Neue Funktionalitäten:

Data Wrangler Flows unterstützt mehrere Instances.
Der Export nach Data Wrangler Job Notebook wurde aktualisiert, um SageMaker SDK 2.20.0 zu verwenden.
Der Export nach Pipeline Notebook wurde aktualisiert, um SDK 2.20.0 zu verwenden. SageMaker
Der Export nach Pipeline Notebook wurde aktualisiert, um ein XGBoost Schulungsbeispiel als optionalen Schritt hinzuzufügen.

Verbesserungen:

Um die Leistung zu verbessern, wird der Import von CSV-Dateien, die mehrere Zeilen in einem einzigen Feld enthalten, nicht mehr unterstützt.

Fehlerbehebungen:

Das Problem mit der Typinferenz im Schnellmodell wurde behoben.
Der Fehler bei der Bias-Metrik in Bias-Berichten wurde behoben.
Die Texttransformation Featurize wurde korrigiert, sodass sie jetzt mit Spalten mit fehlenden Werten funktioniert.
Die integrierten Visualisierungen für Histogramm und Punktdiagramm wurden behoben, sodass sie nun auch mit Datensätzen funktionieren, die array-ähnliche Spalten enthalten.
Die Athena-Abfrage wird jetzt erneut ausgeführt, wenn die Abfrageausführungs-ID abgelaufen ist.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Sicherheit und Berechtigungen

Fehlerbehebung