Importieren von Daten in Canvas - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Importieren von Daten in Canvas

Amazon SageMaker Canvas unterstützt den Import von Tabellen-, Bild- und Dokumentdaten. Sie können Daten sowohl aus lokalen als auch aus externen Datenquellen in Canvas importieren. Verwenden Sie die Datensätze, die Sie importieren, um Modelle zu erstellen und Vorhersagen für andere Datensätze zu treffen.

Jeder Anwendungsfall, für den Sie ein benutzerdefiniertes Modell erstellen können, akzeptiert unterschiedliche Arten von Eingaben. Wenn Sie beispielsweise ein Modell zur Bildklassifizierung mit einer einzigen Bezeichnung erstellen möchten, sollten Sie Bilddaten importieren. Weitere Hinweise zu den unterschiedlichen Modelltypen und den von ihnen akzeptierten Daten finden Sie unter Erstellen eines benutzerdefinierten Modells. Sie können in SageMaker Canvas Daten importieren und benutzerdefinierte Modelle für die folgenden Datentypen erstellen:

  • Tabellarisch (CSV, Parquet oder Tabellen)

    • Kategorisch – Verwenden Sie kategoriale Daten, um benutzerdefinierte kategoriale Vorhersagemodelle für Vorhersagen der Kategorien 2 und 3 zu erstellen.

    • Numerisch – Verwenden Sie numerische Daten, um benutzerdefinierte numerische Vorhersagemodelle zu erstellen.

    • Text – Verwenden Sie Textdaten, um benutzerdefinierte Textvorhersagemodelle für mehrere Kategorien zu erstellen.

    • Zeitreihen – Verwenden Sie Zeitreihendaten, um benutzerdefinierte Prognosemodelle für Zeitreihen zu erstellen.

  • Bild (JPG oder PNG) – Verwenden Sie Bilddaten, um benutzerdefinierte Modelle zur Vorhersage von Bildern mit nur einem Etikett zu erstellen.

  • Dokument (PDF, JPG, PNG, TIFF) — Dokumentdaten werden nur für SageMaker Canvas eady-to-use R-Modelle unterstützt. Weitere Informationen zu eady-to-use R-Modellen, die Vorhersagen für Dokumentdaten treffen können, finden Sie unterVerwenden Sie eady-to-use R-Modelle.

Sie können Daten aus den folgenden Datenquellen in Canvas importieren:

  • Lokale Dateien auf Ihrem Computer

  • Amazon-S3-Buckets

  • Von Amazon Redshift bereitgestellte Cluster (nicht Amazon Redshift Serverless)

  • AWS Glue Data Catalog über Amazon Athena

  • Amazon Aurora

  • Amazon Relational Database Service (Amazon RDS)

  • Salesforce-Datenwolke

  • Snowflake

  • Databricks, SQLServer, MariaDB und andere beliebte Datenbanken über JDBC-Konnektoren

  • Über 40 externe SaaS-Plattformen wie SAP OData

Eine vollständige Liste der Datenquellen, aus denen Sie importieren können, finden Sie in der folgenden Tabelle:

Quelle Typ Unterstützte Datentypen

Lokaler Datei-Upload

Local

Tabellarisch, Bild, Dokument

Amazon Aurora

Amazon intern

Tabellarisch

Amazon-S3-Bucket

Amazon intern

Tabellarisch, Bild, Dokument

Amazon RDS

Amazon intern

Tabellarisch

Von Amazon Redshift bereitgestellte Cluster (nicht Redshift Serverless)

Amazon intern

Tabellarisch

AWS Glue Data Catalog (über Amazon Athena)

Amazon intern

Tabellarisch

Databricks

Extern

Tabellarisch

Snowflake

Extern

Tabellarisch

Salesforce-Datenwolke

Extern

Tabellarisch

SQLServer

Extern

Tabellarisch

MySQL

Extern

Tabellarisch

PostgreSQL

Extern

Tabellarisch

MariaDB

Extern

Tabellarisch

Amplitude

Externe SaaS Plattform

Tabellarisch

CircleCI

Externe SaaS Plattform

Tabellarisch

DocuSign Überwachen

Externe SaaS Plattform

Tabellarisch

Domo

Externe SaaS Plattform

Tabellarisch

Datadog

Externe SaaS Plattform

Tabellarisch

Dynatrace

Externe SaaS Plattform

Tabellarisch

Facebook-Werbung

Externe SaaS Plattform

Tabellarisch

Einblicke in die Facebook-Seite

Externe SaaS Plattform

Tabellarisch

Google-Anzeigen

Externe SaaS Plattform

Tabellarisch

Google Analytics 4

Externe SaaS Plattform

Tabellarisch

Google-Suchkonsole

Externe SaaS Plattform

Tabellarisch

GitHub

Externe SaaS Plattform

Tabellarisch

GitLab

Externe SaaS Plattform

Tabellarisch

Infor Nexus

Externe SaaS Plattform

Tabellarisch

Instagram-Werbung

Externe SaaS Plattform

Tabellarisch

Jira Cloud

Externe SaaS Plattform

Tabellarisch

LinkedIn Werbung

Externe SaaS Plattform

Tabellarisch

LinkedIn Werbung

Externe SaaS Plattform

Tabellarisch

Mailchimp

Externe SaaS Plattform

Tabellarisch

Marketo

Externe SaaS Plattform

Tabellarisch

Microsoft Teams

Externe SaaS Plattform

Tabellarisch

Mischpult

Externe SaaS Plattform

Tabellarisch

Okta

Externe SaaS Plattform

Tabellarisch

Salesforce

Externe SaaS Plattform

Tabellarisch

Salesforce Marketing Cloud

Externe SaaS Plattform

Tabellarisch

Salesforce Pardot

Externe SaaS Plattform

Tabellarisch

SAP OData

Externe SaaS Plattform

Tabellarisch

SendGrid

Externe SaaS Plattform

Tabellarisch

ServiceNow

Externe SaaS Plattform

Tabellarisch

Singular

Externe SaaS Plattform

Tabellarisch

Slack

Externe SaaS Plattform

Tabellarisch

Stripe

Externe SaaS Plattform

Tabellarisch

Trend Micro

Externe SaaS Plattform

Tabellarisch

Typform

Externe SaaS Plattform

Tabellarisch

Veeva

Externe SaaS Plattform

Tabellarisch

Zendesk

Externe SaaS Plattform

Tabellarisch

Zendesk Chat

Externe SaaS Plattform

Tabellarisch

Zendesk Sell

Externe SaaS Plattform

Tabellarisch

Zendesk Sunshine

Externe SaaS Plattform

Tabellarisch

Zoom-Meetings

Externe SaaS Plattform

Tabellarisch

Anweisungen zum Importieren von Daten und Informationen zu den Anforderungen an Eingabedaten, wie z. B. der maximalen Dateigröße für Bilder, finden Sie unter Erstellen eines Datensatzes.

Canvas bietet in Ihrer Anwendung auch mehrere Beispieldatensätze, um Ihnen den Einstieg zu erleichtern. Weitere Informationen zu den SageMaker bereitgestellten Beispieldatensätzen, mit denen Sie experimentieren können, finden Sie unter Verwenden von Beispieldatensätzen.

Nachdem Sie einen Datensatz in Canvas importiert haben, können Sie den Datensatz jederzeit aktualisieren. Sie können eine manuelle Aktualisierung durchführen oder einen Zeitplan für automatische Datensatzaktualisierungen einrichten. Weitere Informationen finden Sie unter Aktualisieren eines Datensatzes.

Weitere Informationen zu jedem Datensatztyp finden Sie in den folgenden Abschnitten:

Tabellarisch

Um Daten aus einer externen Datenquelle (z. B. einer Snowflake-Datenbank oder einer SaaS-Plattform) zu importieren, müssen Sie sich in der Canvas-Anwendung authentifizieren und eine Verbindung mit der Datenquelle herstellen. Weitere Informationen finden Sie unter Verbinden zu Datenquellen.

Nachdem Sie Datensätze in Canvas erstellt haben, können Sie mehrere Datensätze zu einem einzigen Datensatz zusammenfügen. Das Verbinden von Datensätzen wird nur für tabellarische Datensätze unterstützt. Solange Ihre Daten in Tabellen angeordnet sind, können Sie Datensätze aus verschiedenen Quellen wie Amazon Redshift, Amazon Athena oder Snowflake zusammenfügen. Informationen zum Verbinden von Datensätzen finden Sie unter Verknüpfen Sie Daten, die Sie in SageMaker Canvas importiert haben.

Abbild

Informationen darüber, wie Sie einen Bilddatensatz bearbeiten und Aufgaben wie das Zuweisen oder Neuzuweisen von Beschriftungen, das Hinzufügen von Bildern oder das Löschen von Bildern ausführen, finden Sie unter Bearbeiten Sie einen Bilddatensatz.