翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Canvas にデータをインポートする
Amazon SageMaker Canvas は、表形式、画像、およびドキュメントデータのインポートをサポートしています。Canvas では、ローカルデータソースと外部データソースの両方からデータをインポートできます。インポートしたデータセットを使用して、他のデータセットのモデルを構築したり、予測を行ったりします。
カスタムモデルを構築できる各ユースケースは、さまざまなタイプの入力を受け入れます。たとえば、単一ラベルの画像分類モデルを構築する場合は、画像データをインポートする必要があります。各モデルタイプとそれらが受け付けるデータの詳細については、「」を参照してくださいカスタムモデルの構築。 SageMaker Canvas では、以下のデータ型のデータをインポートし、カスタムモデルを作成できます。
-
表形式 (CSV または表)
カテゴリ — カテゴリデータを使用して、2 つと 3 つ以上のカテゴリ予測のためのカスタムカテゴリ予測モデルを構築します。
数値 — 数値データを使用してカスタムの数値予測モデルを構築します。
テキスト — テキストデータを使用して、カスタムのマルチカテゴリテキスト予測モデルを構築します。
時系列 — 時系列データを使用して、カスタムの時系列予測モデルを構築します。
画像 (JPG または PNG) — 画像データを使用して、カスタムの単一ラベル画像予測モデルを構築します。
ドキュメント (PDF、JPG、PNG、TIFF) — ドキュメントデータは SageMaker Canvas Ready-to-use モデルでのみサポートされています。文書データを予測できる Ready-to-use モデルの詳細については、を参照してくださいReady-to-use モデルを使う。
データは、次のデータソースからCanvas にインポートできます。
コンピュータ上のローカルファイル
Amazon S3 バケット
Amazon Redshift
AWS Glue Data CatalogAmazon Athena 経由
Snowflake
SAP OData などの 40 を超える外部 SaaS プラットフォーム
インポートできるデータソースの全リストについては、次の表を参照してください。
ソース | タイプ | サポートされているデータ型 |
---|---|---|
ローカルファイルのアップロード |
[Local] (ローカル) |
表、画像、文書 |
Amazon S3 バケット |
Amazon 内部内部使用目的 |
表、画像、文書 |
Amazon Redshift |
Amazon 内部内部使用目的 |
表形式 |
AWS Glue Data Catalog(アマゾンアテナ経由) |
Amazon 内部内部使用目的 |
表形式 |
Snowflake |
外部 |
表形式 |
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
|
外部SaaS プラットフォーム |
表形式 |
データをインポートする方法と、画像の最大ファイルサイズなどの入力データ要件に関する情報については、を参照してくださいデータセットのインポート。
Canvas には、使用開始に役立つサンプルデータセットがいくつか含まれています。 SageMaker提供されているサンプルデータセットを試してみる方法の詳細については、「サンプルデータセットの使用」を参照してください。
各データセットタイプに固有の詳細については、以下のセクションを参照してください。
表形式
外部データソース (Snowflake データベースや SaaS プラットフォームなど) からデータをインポートするには、Canvas アプリケーションでデータソースを認証して接続する必要があります。詳細については、「データソースへのConnect」を参照してください。
ローカルマシンまたは Amazon S3 の場所にある複数のファイルから表形式のデータをインポートするには、各データソースのデータをインポートし、1 つのデータセットに結合します。データセットの結合は、表形式のデータセットでのみサポートされています。データがテーブルにまとめられている限り、Amazon Redshift、Amazon Athena、または Snowflake など、さまざまなソースのデータセットを結合できます。データセットの結合方法については、「 SageMaker Canvas にインポートしたデータを結合する」を参照してください。
[Image] (イメージ)
画像データセットの編集方法や、ラベルの割り当てや再割り当て、画像の追加、画像の削除などのタスクを実行する方法については、を参照してください画像データセットの編集。