Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Datenimport
Amazon SageMaker Canvas unterstützt den Import von Tabellen-, Bild- und Dokumentdaten. Sie können Datensätze von Ihrem lokalen Computer, von Amazon-Diensten wie Amazon S3 und Amazon Redshift sowie von externen Datenquellen importieren. Wenn Sie Datensätze aus Amazon S3 importieren, können Sie einen Datensatz beliebiger Größe mitbringen. Verwenden Sie die Datensätze, die Sie importieren, um Modelle zu erstellen und Vorhersagen für andere Datensätze zu treffen.
Jeder Anwendungsfall, für den Sie ein benutzerdefiniertes Modell erstellen können, akzeptiert unterschiedliche Arten von Eingaben. Wenn Sie beispielsweise ein Modell zur Bildklassifizierung mit einer einzigen Bezeichnung erstellen möchten, sollten Sie Bilddaten importieren. Weitere Hinweise zu den unterschiedlichen Modelltypen und den von ihnen akzeptierten Daten finden Sie unter Wie funktionieren benutzerdefinierte Modelle. Sie können in SageMaker Canvas Daten importieren und benutzerdefinierte Modelle für die folgenden Datentypen erstellen:
-
Tabellarisch (CSV, Parkett oder Tabellen)
Kategorisch – Verwenden Sie kategoriale Daten, um benutzerdefinierte kategoriale Vorhersagemodelle für Vorhersagen der Kategorien 2 und 3 zu erstellen.
Numerisch – Verwenden Sie numerische Daten, um benutzerdefinierte numerische Vorhersagemodelle zu erstellen.
Text – Verwenden Sie Textdaten, um benutzerdefinierte Textvorhersagemodelle für mehrere Kategorien zu erstellen.
Zeitreihen – Verwenden Sie Zeitreihendaten, um benutzerdefinierte Prognosemodelle für Zeitreihen zu erstellen.
Bild (JPGoderPNG) — Verwenden Sie Bilddaten, um benutzerdefinierte Modelle zur Vorhersage von Bildern mit nur einer Bezeichnung zu erstellen.
Dokument (PDF,, JPGPNG,TIFF) — Dokumentdaten werden nur für SageMaker Ready-to-use Canvas-Modelle unterstützt. Weitere Informationen zu Ready-to-use Modellen, die Vorhersagen für Dokumentdaten treffen können, finden Sie unterReady-to-use Modelle.
Sie können Daten aus den folgenden Datenquellen in Canvas importieren:
Lokale Dateien auf Ihrem Computer
Amazon-S3-Buckets
Von Amazon Redshift bereitgestellte Cluster (nicht Amazon Redshift Serverless)
AWS Glue Data Catalog über Amazon Athena
-
Amazon Aurora
-
Amazon Relational Database Service (AmazonRDS)
-
Salesforce-Datenwolke
Snowflake
-
DatabricksSQLServer, MariaDB und andere beliebte Datenbanken über Konnektoren JDBC
Über 40 externe SaaS-Plattformen, wie SAP OData
Eine vollständige Liste der Datenquellen, aus denen Sie importieren können, finden Sie in der folgenden Tabelle:
Quelle | Typ | Unterstützte Datentypen |
---|---|---|
Lokaler Datei-Upload |
Local |
Tabellarisch, Bild, Dokument |
Amazon Aurora |
Amazon intern |
Tabellarisch |
Amazon-S3-Bucket |
Amazon intern |
Tabellarisch, Bild, Dokument |
Amazon RDS |
Amazon intern |
Tabellarisch |
Von Amazon Redshift bereitgestellte Cluster (nicht Redshift Serverless) |
Amazon intern |
Tabellarisch |
AWS Glue Data Catalog (über Amazon Athena) |
Amazon intern |
Tabellarisch |
Extern |
Tabellarisch |
|
Snowflake |
Extern |
Tabellarisch |
Extern |
Tabellarisch |
|
SQLServer |
Extern |
Tabellarisch |
Mein SQL |
Extern |
Tabellarisch |
Postgret SQL |
Extern |
Tabellarisch |
MariaDB |
Extern |
Tabellarisch |
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
|
Externe SaaS Plattform |
Tabellarisch |
Anweisungen zum Importieren von Daten und Informationen zu den Anforderungen an Eingabedaten, wie z. B. der maximalen Dateigröße für Bilder, finden Sie unter Erstellen eines Datensatzes.
Canvas bietet in Ihrer Anwendung auch mehrere Beispieldatensätze, um Ihnen den Einstieg zu erleichtern. Weitere Informationen zu den von der SageMaker KI bereitgestellten Beispieldatensätzen, mit denen Sie experimentieren können, finden Sie unter Verwenden von Beispieldatensätzen.
Nachdem Sie einen Datensatz in Canvas importiert haben, können Sie den Datensatz jederzeit aktualisieren. Sie können eine manuelle Aktualisierung durchführen oder einen Zeitplan für automatische Datensatzaktualisierungen einrichten. Weitere Informationen finden Sie unter Aktualisieren eines Datensatzes.
Weitere Informationen zu jedem Datensatztyp finden Sie in den folgenden Abschnitten:
Tabellarisch
Um Daten aus einer externen Datenquelle (z. B. einer Snowflake-Datenbank oder einer SaaS-Plattform) zu importieren, müssen Sie sich in der Canvas-Anwendung authentifizieren und eine Verbindung mit der Datenquelle herstellen. Weitere Informationen finden Sie unter Verbinden zu Datenquellen.
Wenn Sie Datensätze, die größer als 5 GB sind, von Amazon S3 nach Canvas importieren möchten, können Sie eine schnellere Probenahme erreichen, indem Sie Amazon Athena verwenden, um die Daten von Amazon S3 abzufragen und abzutasten.
Nachdem Sie Datensätze in Canvas erstellt haben, können Sie Ihre Daten mithilfe der Datenaufbereitungsfunktion von Data Wrangler vorbereiten und transformieren. Sie können Data Wrangler verwenden, um fehlende Werte zu verarbeiten, Ihre Features zu transformieren, mehrere Datensätze zu einem einzigen Datensatz zusammenzuführen und vieles mehr. Weitere Informationen finden Sie unter Datenaufbereitung.
Tipp
Solange Ihre Daten in Tabellen angeordnet sind, können Sie Datensätze aus verschiedenen Quellen wie Amazon Redshift, Amazon Athena oder Snowflake zusammenfügen.
Abbild
Informationen darüber, wie Sie einen Bilddatensatz bearbeiten und Aufgaben wie das Zuweisen oder Neuzuweisen von Beschriftungen, das Hinzufügen von Bildern oder das Löschen von Bildern ausführen, finden Sie unter Bearbeiten Sie einen Bilddatensatz.