Versionshinweise - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Versionshinweise

Data Wrangler wird regelmäßig mit neuen Funktionen und Fehlerbehebungen aktualisiert. Um die Version von Data Wrangler zu aktualisieren, die Sie in Studio verwenden, folgen Sie den Anweisungen unterHerunterfahren und Aktualisieren von Studio-Appsaus.

Versionshinweise

2.2.2022

Neue Funktionalitäten:

  • Sie können jetzt mit Zielknoten exportieren. Weitere Informationen finden Sie unterExport

  • Sie können ORC- und JSON-Dateien importieren. Weitere Informationen zu Dateitypen finden Sie unterImportaus.

  • Data Wrangler unterstützt jetzt die Verwendung der SMOTE-Transformation. Weitere Informationen finden Sie unter Balance -Daten.

  • Data Wrangler unterstützt jetzt die Ähnlichkeitskodierung für kategoriale Daten. Weitere Informationen finden Sie unter Kodieren der Ähnlichkeit.

  • Data Wrangler unterstützt jetzt das Aufheben von JSON-Daten. Weitere Informationen finden Sie unter Unnest JSON-Daten.

  • Data Wrangler unterstützt jetzt die Erweiterung der Werte eines Arrays in separate Spalten. Weitere Informationen finden Sie unter Explode-Array.

  • Data Wrangler unterstützt jetzt die Kontaktaufnahme mit dem Serviceteam, wenn Sie Probleme haben. Weitere Informationen finden Sie unter Fehlerbehebung.

  • Data Wrangler unterstützt das Bearbeiten und Löschen von Schritten in Ihrem Datenfluss. Weitere Informationen finden Sie unter Löschen Sie einen Schritt aus Ihrem Datenfluss und Bearbeiten Sie einen Schritt in Ihrem Data Wrangler-Flow.

  • Sie können jetzt Transformationen für mehrere Spalten durchführen. Weitere Informationen finden Sie unter Transformieren Sie Daten.

  • Data Wrangler unterstützt jetzt Kostenzuordnungs-Tags. Weitere Informationen finden Sie unter Verwendung von Kostenzuordnungs-Tags.

16.10.2021

Neue Funktionen:

Data Wrangler unterstützt jetzt Athena-Arbeitsgruppen. Weitere Informationen finden Sie unter Importieren von Daten aus Athena.

6.10.2021

Neue Funktionen:

Data Wrangler unterstützt jetzt die Transformation von Zeitreihendaten. Weitere Informationen finden Sie unter Transformieren von Zeitreihen.

15.7.2021

Neue Funktionalitäten:

  • Schneeflocke und Data Wranglerwird jetzt unterstützt. Sie können Snowflake als Datenquelle in Data Wrangler verwenden.

  • Unterstützung für benutzerdefiniertes Feldtrennzeichen in CSV hinzugefügt. Jetzt werden Komma, Doppelpunkt, Semikolon, Pipe (|) und Tab unterstützt.

  • Jetzt können Sie Ergebnisse direkt nach Amazon S3 exportieren.

  • Es wurden ein paar neue Multikollinearitätsanalysatoren hinzugefügt: Varianzinflationsfaktoren, Hauptkomponentenanalyse und Lasso-Feature-Auswahl.

Erweiterungen:

  • Die Analysediagramme können nicht mehr mit überlappenden Labels gepackt werden.

Fehlerbehebungen:

  • Ein Hot-Encoder verarbeitet leere Zeichenfolge ordnungsgemäß.

  • Es wurden Abstürze behoben, die auftraten, als der Name der Datenrahmenspalte Punkte enthielt.

26.04.2021

Erweiterungen:

  • Unterstützung für Distributed Processing Jobs hinzugefügt. Sie können mehrere Instanzen verwenden, wenn Sie einen Verarbeitungsauftrag ausführen.

  • Der Datenwrangler-Verarbeitungsauftrag koalesziert jetzt automatisch kleine Ausgaben, wenn die geschätzte Ergebnisgröße weniger als 1 Gigabyte beträgt.

  • Feature Store-Notebook: Verbesserte Leistung bei der Aufnahme von feature store

  • Data Wrangler Processing Jobs verwenden jetzt 1.x als maßgebliches Container-Tag für future Releases.

Fehlerbehebungen:

  • Es wurden Probleme beim Rendern für ein facettiertes Histogramm behoben.

  • FixedIn Verarbeitungsauftrag exportierenum Vektortypspalten zu unterstützen.

  • FixedExtract using regex-Operator, um die erste erfasste Gruppe zurückzugeben, wenn eine oder mehrere im regulären Ausdruck oder Regex vorhanden sind.

8.2.2021

Neue Funktionalitäten:

  • Data Wrangler Flows unterstützt mehrere Instanzen.

  • Export to Data Wrangler Job Notizbuch zur Verwendung aktualisiert SageMaker SDK 2.20.0.

  • Zu verwendender Export in Pipeline-Notizbuch aktualisiert SageMaker SDK 2.20.0.

  • In Pipeline-Notebook exportieren wurde aktualisiert, um ein XGBoost-Schulungsbeispiel als optionalen Schritt hinzuzufügen.

Erweiterungen:

  • Um die Leistung zu verbessern, wird das Importieren von CSV-Dateien, die mehrere Zeilen in einem einzigen Feld enthalten, nicht mehr unterstützt.

Fehlerbehebungen:

  • Es wurde ein Problem mit der Typ-Inferenz im Schnellmodell behoben.

  • Der Fehler bei Bias-Metrik in Bias-Berichten wurde behoben.

  • Die Featurize-Texttransformation wurde korrigiert, um mit Spalten mit fehlenden Werten zu arbeiten.

  • Das Histogramm- und Scatter-Plot-integrierte Visualisierungen wurde behoben, um mit Datensätzen zu arbeiten, die Array-ähnliche Spalten enthalten.

  • Die Athena-Abfrage wird jetzt erneut ausgeführt, wenn die Ausführungs-ID der Abfrage abgelaufen ist.