Canvas にデータをインポートする - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Canvas にデータをインポートする

アマゾン SageMaker Canvasは、表形式、画像、およびドキュメントデータのインポートをサポートしています。ローカルデータソースと外部データソースの両方からCanvasにデータをインポートできます。インポートしたデータセットは、モデルを構築し、他のデータセットの予測を行うために使用します。

カスタムモデルを構築できるユースケースはそれぞれ、異なるタイプの入力を受け入れます。たとえば、単一ラベルの画像分類モデルを構築する場合は、画像データをインポートする必要があります。モデルタイプとモデルタイプが受け付けるデータについては、「」を参照してください。カスタムモデルを構築する。にデータをインポートしてカスタムモデルを構築できます。 SageMaker 次のデータタイプのキャンバス

  • 表形式(CSV、寄木細工、またはテーブル)

    • カテゴリ — カテゴリデータを使用して、2 つまたは 3 つ以上のカテゴリ予測用のカスタムカテゴリ予測モデルを構築します。

    • 数値 — 数値データを使用してカスタムの数値予測モデルを構築します。

    • テキスト — テキストデータを使用して、マルチカテゴリのカスタムテキスト予測モデルを構築します。

    • 時系列 — 時系列データを使用してカスタムの時系列予測モデルを構築します。

  • 画像(JPG または PNG) — 画像データを使用して、カスタムの単一ラベル画像予測モデルを構築します。

  • 文書(PDF、JPG、PNG、TIFF) — ドキュメントデータは次の場合のみサポートされます SageMaker キャンバスeady-to-use モデル。R をインストールeady-to-use 文書データを予測できるモデルについては、以下を参照してください。R を使用eady-to-use モデル

Canvasには、次のデータソースからデータをインポートできます。

  • コンピュータ上のローカルの記録を有効にする

  • Amazon S3 バケット

  • Amazon Redshift

  • AWS Glue Data CatalogAmazon Athena をインストール

  • Amazon Aurora

  • Amazon Relational Database Service (Amazon RDS)

  • セールスフォース・データクラウド

  • Snowflake

  • データブリックス、SQLServer、MariaDB、およびその他の一般的なデータベース (JDBC コネクタを使用)

  • SAP OData などの 40 を超える外部 SaaS プラットフォーム

インポート元となるデータソースの完全なリストについては、以下の表を参照してください。

ソース タイプ サポートされているデータ型

ローカルでのファイルのアップロード

[Local] (ローカル)

表、画像、文書

Amazon Aurora

アマゾン社内

表形式

Amazon S3 バケット

アマゾン社内

表、画像、文書

Amazon RDS

アマゾン社内

表形式

Amazon Redshift

アマゾン社内

表形式

AWS Glue Data Catalog(Amazon Athena 経由)

アマゾン社内

表形式

データブリックス

外部

表形式

Snowflake

外部

表形式

セールスフォース・データクラウド

外部

表形式

SQL サーバー

外部

表形式

MySQL

外部

表形式

PostgreSQL

外部

表形式

MariaDB

外部

表形式

振幅

外部 SaaS プラットフォーム

表形式

CircleCI

外部 SaaS プラットフォーム

表形式

DocuSign モニター

外部 SaaS プラットフォーム

表形式

ドーモ

外部 SaaS プラットフォーム

表形式

データドッグ

外部 SaaS プラットフォーム

表形式

ダイナトレース

外部 SaaS プラットフォーム

表形式

Facebook の更新

外部 SaaS プラットフォーム

表形式

フェイスブックページ予測

外部 SaaS プラットフォーム

表形式

Google Amplify

外部 SaaS プラットフォーム

表形式

グーグルアナリティクス 4

外部 SaaS プラットフォーム

表形式

Google 検索コンソール

外部 SaaS プラットフォーム

表形式

GitHub

外部 SaaS プラットフォーム

表形式

GitLab

外部 SaaS プラットフォーム

表形式

インフォア・ネクサス

外部 SaaS プラットフォーム

表形式

インスタグラム広告

外部 SaaS プラットフォーム

表形式

Jira クラウド

外部 SaaS プラットフォーム

表形式

LinkedIn 広告

外部 SaaS プラットフォーム

表形式

LinkedIn 広告

外部 SaaS プラットフォーム

表形式

メールチンプ

外部 SaaS プラットフォーム

表形式

マルケト

外部 SaaS プラットフォーム

表形式

Microsoft チーム

外部 SaaS プラットフォーム

表形式

ミックスパネル

外部 SaaS プラットフォーム

表形式

Okta

外部 SaaS プラットフォーム

表形式

営業部隊

外部 SaaS プラットフォーム

表形式

Salesforce マーケティングクラウド

外部 SaaS プラットフォーム

表形式

セールスフォース・パラドット

外部 SaaS プラットフォーム

表形式

SAP

外部 SaaS プラットフォーム

表形式

SendGrid

外部 SaaS プラットフォーム

表形式

ServiceNow

外部 SaaS プラットフォーム

表形式

単数形

外部 SaaS プラットフォーム

表形式

スラック

外部 SaaS プラットフォーム

表形式

ストライプ

外部 SaaS プラットフォーム

表形式

Trend Micro

外部 SaaS プラットフォーム

表形式

タイプ/フォーム

外部 SaaS プラットフォーム

表形式

Veeva

外部 SaaS プラットフォーム

表形式

Zendesk

外部 SaaS プラットフォーム

表形式

Zendesk の更新

外部 SaaS プラットフォーム

表形式

Zendesk Sell

外部 SaaS プラットフォーム

表形式

ゼンデスクサンシャイン

外部 SaaS プラットフォーム

表形式

ズームミーティング

外部 SaaS プラットフォーム

表形式

データのインポート方法や、画像の最大ファイルサイズなどの入力データ要件に関する情報については、を参照してください。データセットを作成します。

Canvasには、使い始めるのに役立つサンプルデータセットもいくつか用意されています。について詳しく知るには SageMaker-実験可能なサンプルデータセットが提供されています。Cloud Canvas の管理

データセットを Canvas にインポートした後は、いつでもデータセットを更新できます。手動で更新することも、データセットを自動更新するスケジュールを設定することもできます。詳細については、「データセットを更新します。」を参照してください。

各データセットタイプに固有の詳細については、以下のセクションを参照してください。

表形式

外部データソース (Snowflakeデータベースや SaaS プラットフォームなど) からデータをインポートするには、Canvas アプリケーションのデータソースを認証して接続する必要があります。詳細については、「データソースへのConnect」を参照してください。

Canvas でデータセットを作成すると、複数のデータセットを 1 つのデータセットに結合できます。データセットの結合は表形式のデータセットでのみサポートされています。データがテーブルにアップサンプリングする場合、Amazon Redshift、Amazon Athena、Snowflakeなど、さまざまなソースからのデータセットを結合できます。データセットの結合方法については、「にインポートされる場合。 SageMaker キャンバス」を参照してください。

[Image] (イメージ)

イメージデータセットを編集し、ラベルの割り当てや再割り当て、イメージの追加、イメージの削除などのタスクを実行する方法については、を参照してください。画像データセットを編集します。