Daten importieren - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Daten importieren

Amazon SageMaker Canvas unterstützt den Import von Tabellen-, Bild- und Dokumentdaten. Sie können Datensätze von Ihrem lokalen Computer, von Amazon-Diensten wie Amazon S3 und Amazon Redshift sowie von externen Datenquellen importieren. Wenn Sie Datensätze aus Amazon S3 importieren, können Sie einen Datensatz beliebiger Größe mitbringen. Verwenden Sie die Datensätze, die Sie importieren, um Modelle zu erstellen und Vorhersagen für andere Datensätze zu treffen.

Jeder Anwendungsfall, für den Sie ein benutzerdefiniertes Modell erstellen können, akzeptiert unterschiedliche Arten von Eingaben. Wenn Sie beispielsweise ein Modell zur Bildklassifizierung mit einer einzigen Bezeichnung erstellen möchten, sollten Sie Bilddaten importieren. Weitere Hinweise zu den unterschiedlichen Modelltypen und den von ihnen akzeptierten Daten finden Sie unter Wie funktionieren benutzerdefinierte Modelle. Sie können in SageMaker Canvas Daten importieren und benutzerdefinierte Modelle für die folgenden Datentypen erstellen:

  • Tabellarisch (CSV, Parkett oder Tabellen)

    • Kategorisch – Verwenden Sie kategoriale Daten, um benutzerdefinierte kategoriale Vorhersagemodelle für Vorhersagen der Kategorien 2 und 3 zu erstellen.

    • Numerisch – Verwenden Sie numerische Daten, um benutzerdefinierte numerische Vorhersagemodelle zu erstellen.

    • Text – Verwenden Sie Textdaten, um benutzerdefinierte Textvorhersagemodelle für mehrere Kategorien zu erstellen.

    • Zeitreihen – Verwenden Sie Zeitreihendaten, um benutzerdefinierte Prognosemodelle für Zeitreihen zu erstellen.

  • Bild (JPGoderPNG) — Verwenden Sie Bilddaten, um benutzerdefinierte Modelle zur Vorhersage von Bildern mit nur einer Bezeichnung zu erstellen.

  • Dokument (PDF,, JPGPNG,TIFF) — Dokumentdaten werden nur für SageMaker Ready-to-use Canvas-Modelle unterstützt. Weitere Informationen zu Ready-to-use Modellen, die Vorhersagen für Dokumentdaten treffen können, finden Sie unterReady-to-use Modelle.

Sie können Daten aus den folgenden Datenquellen in Canvas importieren:

  • Lokale Dateien auf Ihrem Computer

  • Amazon-S3-Buckets

  • Von Amazon Redshift bereitgestellte Cluster (nicht Amazon Redshift Serverless)

  • AWS Glue Data Catalog über Amazon Athena

  • Amazon Aurora

  • Amazon Relational Database Service (AmazonRDS)

  • Salesforce-Datenwolke

  • Snowflake

  • DatabricksSQLServer, MariaDB und andere beliebte Datenbanken über Konnektoren JDBC

  • Über 40 externe SaaS-Plattformen, wie SAP OData

Eine vollständige Liste der Datenquellen, aus denen Sie importieren können, finden Sie in der folgenden Tabelle:

Quelle Typ Unterstützte Datentypen

Lokaler Datei-Upload

Local

Tabellarisch, Bild, Dokument

Amazon Aurora

Amazon intern

Tabellarisch

Amazon-S3-Bucket

Amazon intern

Tabellarisch, Bild, Dokument

Amazon RDS

Amazon intern

Tabellarisch

Von Amazon Redshift bereitgestellte Cluster (nicht Redshift Serverless)

Amazon intern

Tabellarisch

AWS Glue Data Catalog (über Amazon Athena)

Amazon intern

Tabellarisch

Databricks

Extern

Tabellarisch

Snowflake

Extern

Tabellarisch

Salesforce-Datenwolke

Extern

Tabellarisch

SQLServer

Extern

Tabellarisch

Mein SQL

Extern

Tabellarisch

Postgret SQL

Extern

Tabellarisch

MariaDB

Extern

Tabellarisch

Amplitude

Externe SaaS Plattform

Tabellarisch

CircleCI

Externe SaaS Plattform

Tabellarisch

DocuSign Überwachen

Externe SaaS Plattform

Tabellarisch

Domo

Externe SaaS Plattform

Tabellarisch

Datadog

Externe SaaS Plattform

Tabellarisch

Dynatrace

Externe SaaS Plattform

Tabellarisch

Facebook-Werbung

Externe SaaS Plattform

Tabellarisch

Einblicke in die Facebook-Seite

Externe SaaS Plattform

Tabellarisch

Google-Anzeigen

Externe SaaS Plattform

Tabellarisch

Google Analytics 4

Externe SaaS Plattform

Tabellarisch

Google-Suchkonsole

Externe SaaS Plattform

Tabellarisch

GitHub

Externe SaaS Plattform

Tabellarisch

GitLab

Externe SaaS Plattform

Tabellarisch

Infor Nexus

Externe SaaS Plattform

Tabellarisch

Instagram-Werbung

Externe SaaS Plattform

Tabellarisch

Jira Cloud

Externe SaaS Plattform

Tabellarisch

LinkedIn Werbung

Externe SaaS Plattform

Tabellarisch

LinkedIn Werbeanzeigen

Externe SaaS Plattform

Tabellarisch

Mailchimp

Externe SaaS Plattform

Tabellarisch

Marketo

Externe SaaS Plattform

Tabellarisch

Microsoft Teams

Externe SaaS Plattform

Tabellarisch

Mischpult

Externe SaaS Plattform

Tabellarisch

Okta

Externe SaaS Plattform

Tabellarisch

Salesforce

Externe SaaS Plattform

Tabellarisch

Salesforce Marketing Cloud

Externe SaaS Plattform

Tabellarisch

Salesforce Pardot

Externe SaaS Plattform

Tabellarisch

SAP OData

Externe SaaS Plattform

Tabellarisch

SendGrid

Externe SaaS Plattform

Tabellarisch

ServiceNow

Externe SaaS Plattform

Tabellarisch

Singular

Externe SaaS Plattform

Tabellarisch

Slack

Externe SaaS Plattform

Tabellarisch

Stripe

Externe SaaS Plattform

Tabellarisch

Trend Micro

Externe SaaS Plattform

Tabellarisch

Typform

Externe SaaS Plattform

Tabellarisch

Veeva

Externe SaaS Plattform

Tabellarisch

Zendesk

Externe SaaS Plattform

Tabellarisch

Zendesk Chat

Externe SaaS Plattform

Tabellarisch

Zendesk Sell

Externe SaaS Plattform

Tabellarisch

Zendesk Sunshine

Externe SaaS Plattform

Tabellarisch

Zoom-Meetings

Externe SaaS Plattform

Tabellarisch

Anweisungen zum Importieren von Daten und Informationen zu den Anforderungen an Eingabedaten, wie z. B. der maximalen Dateigröße für Bilder, finden Sie unter Erstellen eines Datensatzes.

Canvas bietet in Ihrer Anwendung auch mehrere Beispieldatensätze, um Ihnen den Einstieg zu erleichtern. Weitere Informationen zu den SageMaker bereitgestellten Beispieldatensätzen, mit denen Sie experimentieren können, finden Sie unter Verwenden von Beispieldatensätzen.

Nachdem Sie einen Datensatz in Canvas importiert haben, können Sie den Datensatz jederzeit aktualisieren. Sie können eine manuelle Aktualisierung durchführen oder einen Zeitplan für automatische Datensatzaktualisierungen einrichten. Weitere Informationen finden Sie unter Aktualisieren eines Datensatzes.

Weitere Informationen zu jedem Datensatztyp finden Sie in den folgenden Abschnitten:

Tabellarisch

Um Daten aus einer externen Datenquelle (z. B. einer Snowflake-Datenbank oder einer SaaS-Plattform) zu importieren, müssen Sie sich in der Canvas-Anwendung authentifizieren und eine Verbindung mit der Datenquelle herstellen. Weitere Informationen finden Sie unter Verbinden zu Datenquellen.

Wenn Sie Datensätze, die größer als 5 GB sind, von Amazon S3 nach Canvas importieren möchten, können Sie eine schnellere Probenahme erreichen, indem Sie Amazon Athena verwenden, um die Daten von Amazon S3 abzufragen und abzutasten.

Nachdem Sie Datensätze in Canvas erstellt haben, können Sie Ihre Daten mithilfe der Datenaufbereitungsfunktion von Data Wrangler vorbereiten und transformieren. Sie können Data Wrangler verwenden, um fehlende Werte zu verarbeiten, Ihre Features zu transformieren, mehrere Datensätze zu einem einzigen Datensatz zusammenzuführen und vieles mehr. Weitere Informationen finden Sie unter Datenaufbereitung.

Tipp

Solange Ihre Daten in Tabellen angeordnet sind, können Sie Datensätze aus verschiedenen Quellen wie Amazon Redshift, Amazon Athena oder Snowflake zusammenfügen.

Abbild

Informationen darüber, wie Sie einen Bilddatensatz bearbeiten und Aufgaben wie das Zuweisen oder Neuzuweisen von Beschriftungen, das Hinzufügen von Bildern oder das Löschen von Bildern ausführen, finden Sie unter Bearbeiten Sie einen Bilddatensatz.