本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
將資料匯入 Canvas。
Amazon SageMaker Canvas 支援匯入表格式、影像和文件資料。您可以將資料從本機和外部資料來源匯入 Canvas。使用您匯入的資料集來建置模型並預測其他資料集。
您可以建立自訂模型的每個使用案例都接受不同類型的輸入。例如,如果您要建置單一標籤影像分類模型,則應匯入影像資料。如需有關不同模型類型及其接受資料的更多相關資訊,請參閱建置您的自訂模型。您可以在 SageMaker Canvas 中導入數據並為以下數據類型構建自定義模型:
-
表格式 (CSV、Parquet 或資料表)
分類 — 使用分類資料建置 2 和 3 個以上類別預測的自訂分類預測模型。
數字 — 使用數值資料建置自訂的數值預測模型。
文字 — 使用文字資料建置自訂的多類別文字預測模型。
時間序列 — 使用時間序列資料來建置自訂時間序列預測模型。
映像 (JPG 或 PNG) — 使用映像資料建置自訂的單一標籤影像預測模型。
文件 (PDF、JPG、PNG、TIFF) — 僅支援「 SageMaker 畫布 R」eady-to-use 模型的文件資料。若要進一步瞭解可對文件資料進行預測的 R eady-to-use 模型,請參閱使用 R eady-to-use 型號。
您可以從下列資料來源將資料匯入 Canvas:
本機電腦上的檔案
Amazon S3 儲存貯體
Amazon Redshift 佈建的叢集 (不是 Amazon Redshift 無伺服器)
AWS Glue Data Catalog 透過 Amazon Athena
-
Amazon Aurora
-
Amazon Relational Database Service (Amazon RDS)
-
Salesforce Data Cloud
Snowflake
-
Databricks、SQLServer、MariaDB 和其他透過 JDBC 連接器的 熱門資料庫
超過 40 個外部軟體 SaaS 平台,例如 SAP OData
如需可從中匯入資料來源的完整清單,請參閱下表:
來源 | Type | 支援的資料類型 |
---|---|---|
本機檔案上傳 |
區域 |
表格式、影像、文件 |
Amazon Aurora |
Amazon 內部 |
表格式 |
Amazon S3 儲存貯體 |
Amazon 內部 |
表格式、影像、文件 |
Amazon RDS |
Amazon 內部 |
表格式 |
Amazon Redshift 佈建的叢集 (非 Redshift 無伺服器) |
Amazon 內部 |
表格式 |
AWS Glue Data Catalog (通過 Amazon Athena) |
Amazon 內部 |
表格式 |
外部 |
表格式 |
|
Snowflake |
外部 |
表格式 |
外部 |
表格式 |
|
sqlserver |
外部 |
表格式 |
MySQL |
外部 |
表格式 |
PostgreSQL |
外部 |
表格式 |
MariaDB |
外部 |
表格式 |
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
|
外部 SaaS 平台 |
表格式 |
如需有關如何匯入資料和輸入資料需求的資訊,例如影像的檔案大小上限等的指示,請參閱建立資料集。
Canvas 也在您的應用程式中提供多個範例資料集,協助您快速入門。若要深入瞭解您可以嘗試的 SageMaker提供範例資料集,請參閱使用範例資料集。
將資料集匯入 Canvas 之後,您可以隨時更新資料集。您可以進行手動更新,也可以設定自動更新資料集的排程。如需詳細資訊,請參閱 更新資料集。
如需各個資料集類型的更多資訊,請參閱下列章節:
表格式
若要從外部資料來源 (例如 Snowflake 資料庫或 SaaS 平台) 匯入資料,您必須在 Canvas 應用程式中驗證並連線至資料來源。如需詳細資訊,請參閱 連線至資料來源。
在 Canvas 中建立資料集之後,您可以將聯結多個資料集合成單一資料集。僅支援表格式資料集的聯結資料集。只要將資料排列到資料表中,就可以聯結來自各種來源的資料集,例如 Amazon Redshift、Amazon Athena 或 Snowflake。如需聯結資料集的詳細資訊,請參閱聯結您匯入到 SageMaker 畫布中的資料。
影像
如需有關如何編輯影像資料集和執行指派或重新指派標籤、新增影像或刪除圖片等任務的資訊,請參閱編輯影像資料集。