Importación de datos a Canvas. - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Importación de datos a Canvas.

Amazon SageMaker Canvas admite la importación de datos tabulares, de imágenes y de documentos. Puede importar datos a Canvas desde orígenes de datos locales y externos. Utilice los conjuntos de datos que importe para crear modelos y hacer predicciones para otros conjuntos de datos.

Cada caso de uso para el que puede crear un modelo personalizado acepta diferentes tipos de entrada. Por ejemplo, si desea crear un modelo de clasificación de imágenes de una sola etiqueta, debe importar datos de imágenes. Para obtener más información acerca de los distintos tipos de modelo y los datos que aceptan, consulte Creación de un modelo personalizado. Puede importar datos y crear modelos personalizados en SageMaker Canvas para los siguientes tipos de datos:

  • Tabulares (CSV, Parquet o tablas)

    • Categóricos: utilice datos categóricos para crear modelos de predicción categórica personalizados para la predicción de más de 2 y 3 categorías.

    • Numéricos: utilice datos numéricos para crear modelos de predicción numérica personalizados.

    • Texto: utilice datos de texto para crear modelos personalizados de predicción de texto multicategoría.

    • Series temporales: utilice datos de series temporales para crear modelos de previsión de series temporales personalizados.

  • Imágenes (JPG o PNG): utilice datos de imágenes para crear modelos personalizados de predicción de imágenes de etiqueta única.

  • Documento (PDF, JPG, PNG, TIFF): los datos del documento solo se admiten en eady-to-use los modelos SageMaker Canvas R. Para obtener más información sobre eady-to-use los modelos R que pueden realizar predicciones para los datos de los documentos, consulteUsa eady-to-use modelos R.

Puede importar datos a Canvas desde los siguientes orígenes de datos:

  • Archivos locales de su equipo

  • Buckets de Amazon S3

  • Clústeres aprovisionados por Amazon Redshift (no Amazon Redshift Serverless)

  • AWS Glue Data Catalog a través de Amazon Athena

  • Amazon Aurora

  • Amazon Relational Database Service (Amazon RDS)

  • Salesforce Data Cloud

  • Snowflake

  • Databricks, SQLServer, MariaDB y otras bases de datos populares a través de conectores JDBC

  • Más de 40 plataformas de SaaS externas, como SAP OData

Para obtener una lista completa de las fuentes de datos desde las que puede importar, consulte la siguiente tabla:

Origen Tipo Tipos de datos compatibles

Carga de archivos locales

Local

Tabular, imagen, documento

Amazon Aurora

Interno de Amazon

Tabular

Bucket de Amazon S3

Interno de Amazon

Tabular, imagen, documento

Amazon RDS

Interno de Amazon

Tabular

Clústeres aprovisionados por Amazon Redshift (no por Redshift Serverless)

Interno de Amazon

Tabular

AWS Glue Data Catalog (a través de Amazon Athena)

Interno de Amazon

Tabular

Databricks

Externo

Tabular

Snowflake

Externo

Tabular

Salesforce Data Cloud

Externo

Tabular

SQLServer

Externo

Tabular

MySQL

Externo

Tabular

PostgreSQL

Externo

Tabular

MariaDB

Externo

Tabular

Amplitude

Plataforma de SaaS externa

Tabular

CircleCI

Plataforma de SaaS externa

Tabular

DocuSign Supervisar

Plataforma de SaaS externa

Tabular

Domo

Plataforma de SaaS externa

Tabular

Datadog

Plataforma de SaaS externa

Tabular

Dynatrace

Plataforma de SaaS externa

Tabular

Facebook Ads

Plataforma de SaaS externa

Tabular

Insights de la página de Facebook

Plataforma de SaaS externa

Tabular

Google Ads

Plataforma de SaaS externa

Tabular

Google Analytics 4

Plataforma de SaaS externa

Tabular

Consola de búsqueda de Google

Plataforma de SaaS externa

Tabular

GitHub

Plataforma de SaaS externa

Tabular

GitLab

Plataforma de SaaS externa

Tabular

Infor Nexus

Plataforma de SaaS externa

Tabular

Publicidad en Instagram

Plataforma de SaaS externa

Tabular

Jira Cloud

Plataforma de SaaS externa

Tabular

LinkedIn Anuncios

Plataforma de SaaS externa

Tabular

LinkedIn Anuncios

Plataforma de SaaS externa

Tabular

Mailchimp

Plataforma de SaaS externa

Tabular

Marketo

Plataforma de SaaS externa

Tabular

Microsoft Teams

Plataforma de SaaS externa

Tabular

Mixpanel

Plataforma de SaaS externa

Tabular

Okta

Plataforma de SaaS externa

Tabular

Salesforce

Plataforma de SaaS externa

Tabular

Salesforce Marketing Cloud

Plataforma de SaaS externa

Tabular

Salesforce Pardot

Plataforma de SaaS externa

Tabular

SAP OData

Plataforma de SaaS externa

Tabular

SendGrid

Plataforma de SaaS externa

Tabular

ServiceNow

Plataforma de SaaS externa

Tabular

Singular

Plataforma de SaaS externa

Tabular

Slack

Plataforma de SaaS externa

Tabular

Stripe

Plataforma de SaaS externa

Tabular

Trend Micro

Plataforma de SaaS externa

Tabular

Typeform

Plataforma de SaaS externa

Tabular

Veeva

Plataforma de SaaS externa

Tabular

Zendesk

Plataforma de SaaS externa

Tabular

Zendesk Chat

Plataforma de SaaS externa

Tabular

Zendesk Sell

Plataforma de SaaS externa

Tabular

Zendesk Sunshine

Plataforma de SaaS externa

Tabular

Zoom Meetings

Plataforma de SaaS externa

Tabular

Para obtener instrucciones sobre cómo importar datos e información sobre los requisitos de datos de entrada, como el tamaño máximo de archivo para las imágenes, consulte Creación de un conjunto de datos.

Canvas también proporciona varios conjuntos de datos de muestra en su aplicación para ayudarle a comenzar. Para obtener más información sobre los conjuntos SageMaker de datos de muestra proporcionados con los que puedes experimentar, consulta Usar conjuntos de datos de muestra.

Después de importar un conjunto de datos a Canvas, puede actualizarlo en cualquier momento. Puede realizar una actualización manual o configurar un cronograma para las actualizaciones automáticas del conjunto de datos. Para obtener más información, consulte Actualización de un conjunto de datos.

Para obtener más información específica para cada tipo de conjunto de datos, consulte las siguientes secciones:

Tabular

Para importar datos de un origen de datos externo (como una base de datos Snowflake o una plataforma SaaS), debe autenticarse y conectarse al origen de datos en la aplicación de Canvas. Para obtener más información, consulte Conexión con orígenes de datos.

Después de crear conjuntos de datos en Canvas, puede unir varios conjuntos de datos en un solo conjunto de datos. La unión de conjuntos de datos solo es compatible con conjuntos de datos tabulares. Siempre que los datos estén organizados en tablas, puede unir conjuntos de datos de diversas fuentes, como Amazon Redshift, Amazon Athena o Snowflake. Para obtener información sobre la unión de conjuntos de datos, consulte Une los datos que has importado a SageMaker Canvas.

Imagen

Para obtener información sobre cómo editar un conjunto de datos de imágenes y realizar tareas como asignar o reasignar etiquetas, añadir o eliminar imágenes, consulte Edición de un conjunto de datos de imágenes.