Canvas にデータをインポートする - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Canvas にデータをインポートする

Amazon SageMaker Canvas は、表形式、画像、およびドキュメントデータのインポートをサポートしています。Canvas では、ローカルデータソースと外部データソースの両方からデータをインポートできます。インポートしたデータセットを使用して、他のデータセットのモデルを構築したり、予測を行ったりします。

カスタムモデルを構築できる各ユースケースは、さまざまなタイプの入力を受け入れます。たとえば、単一ラベルの画像分類モデルを構築する場合は、画像データをインポートする必要があります。各モデルタイプとそれらが受け付けるデータの詳細については、「」を参照してくださいカスタムモデルの構築。 SageMaker Canvas では、以下のデータ型のデータをインポートし、カスタムモデルを作成できます。

  • 表形式 (CSV または表)

    • カテゴリ — カテゴリデータを使用して、2 つと 3 つ以上のカテゴリ予測のためのカスタムカテゴリ予測モデルを構築します。

    • 数値 — 数値データを使用してカスタムの数値予測モデルを構築します。

    • テキスト — テキストデータを使用して、カスタムのマルチカテゴリテキスト予測モデルを構築します。

    • 時系列 — 時系列データを使用して、カスタムの時系列予測モデルを構築します。

  • 画像 (JPG または PNG) — 画像データを使用して、カスタムの単一ラベル画像予測モデルを構築します。

  • ドキュメント (PDF、JPG、PNG、TIFF) — ドキュメントデータは SageMaker Canvas Ready-to-use モデルでのみサポートされています。文書データを予測できる Ready-to-use モデルの詳細については、を参照してくださいReady-to-use モデルを使う

データは、次のデータソースからCanvas にインポートできます。

  • コンピュータ上のローカルファイル

  • Amazon S3 バケット

  • Amazon Redshift

  • AWS Glue Data CatalogAmazon Athena 経由

  • Snowflake

  • SAP OData などの 40 を超える外部 SaaS プラットフォーム

インポートできるデータソースの全リストについては、次の表を参照してください。

ソース タイプ サポートされているデータ型

ローカルファイルのアップロード

[Local] (ローカル)

表、画像、文書

Amazon S3 バケット

Amazon 内部内部使用目的

表、画像、文書

Amazon Redshift

Amazon 内部内部使用目的

表形式

AWS Glue Data Catalog(アマゾンアテナ経由)

Amazon 内部内部使用目的

表形式

Snowflake

外部

表形式

振幅

外部SaaS プラットフォーム

表形式

CircleCI

外部SaaS プラットフォーム

表形式

DocuSign モニター

外部SaaS プラットフォーム

表形式

ドーモ

外部SaaS プラットフォーム

表形式

データドッグ

外部SaaS プラットフォーム

表形式

ダイナトレース

外部SaaS プラットフォーム

表形式

フェイスブック広告

外部SaaS プラットフォーム

表形式

フェイスブックページインサイト

外部SaaS プラットフォーム

表形式

グーグル広告

外部SaaS プラットフォーム

表形式

グーグルアナリティクス 4

外部SaaS プラットフォーム

表形式

Google 検索コンソール

外部SaaS プラットフォーム

表形式

GitHub

外部SaaS プラットフォーム

表形式

GitLab

外部SaaS プラットフォーム

表形式

インフォアネクサス

外部SaaS プラットフォーム

表形式

インスタグラム広告

外部SaaS プラットフォーム

表形式

JIRA クラウド

外部SaaS プラットフォーム

表形式

LinkedIn 広告

外部SaaS プラットフォーム

表形式

LinkedIn 広告

外部SaaS プラットフォーム

表形式

Mailchimp

外部SaaS プラットフォーム

表形式

マルケト

外部SaaS プラットフォーム

表形式

マイクロソフトチーム

外部SaaS プラットフォーム

表形式

ミックスパネル

外部SaaS プラットフォーム

表形式

Okta

外部SaaS プラットフォーム

表形式

セールスフォース

外部SaaS プラットフォーム

表形式

セールスフォース・マーケティング・クラウド

外部SaaS プラットフォーム

表形式

セールスフォースパルドット

外部SaaS プラットフォーム

表形式

SAP OData

外部SaaS プラットフォーム

表形式

SendGrid

外部SaaS プラットフォーム

表形式

ServiceNow

外部SaaS プラットフォーム

表形式

単数

外部SaaS プラットフォーム

表形式

スラック

外部SaaS プラットフォーム

表形式

ストライプ

外部SaaS プラットフォーム

表形式

Trend Micro

外部SaaS プラットフォーム

表形式

タイプフォーム

外部SaaS プラットフォーム

表形式

ヴィーバ

外部SaaS プラットフォーム

表形式

Zendesk

外部SaaS プラットフォーム

表形式

Zendesk チャット

外部SaaS プラットフォーム

表形式

Zendesk Sell

外部SaaS プラットフォーム

表形式

Zendesk サンシャイン

外部SaaS プラットフォーム

表形式

ズームミーティング

外部SaaS プラットフォーム

表形式

データをインポートする方法と、画像の最大ファイルサイズなどの入力データ要件に関する情報については、を参照してくださいデータセットのインポート

Canvas には、使用開始に役立つサンプルデータセットがいくつか含まれています。 SageMaker提供されているサンプルデータセットを試してみる方法の詳細については、「サンプルデータセットの使用」を参照してください。

各データセットタイプに固有の詳細については、以下のセクションを参照してください。

表形式

外部データソース (Snowflake データベースや SaaS プラットフォームなど) からデータをインポートするには、Canvas アプリケーションでデータソースを認証して接続する必要があります。詳細については、「データソースへのConnect」を参照してください。

ローカルマシンまたは Amazon S3 の場所にある複数のファイルから表形式のデータをインポートするには、各データソースのデータをインポートし、1 つのデータセットに結合します。データセットの結合は、表形式のデータセットでのみサポートされています。データがテーブルにまとめられている限り、Amazon Redshift、Amazon Athena、または Snowflake など、さまざまなソースのデータセットを結合できます。データセットの結合方法については、「 SageMaker Canvas にインポートしたデータを結合する」を参照してください。

[Image] (イメージ)

画像データセットの編集方法や、ラベルの割り当てや再割り当て、画像の追加、画像の削除などのタスクを実行する方法については、を参照してください画像データセットの編集