翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データセットを更新する
初期データセットを Amazon SageMaker Canvas にインポートした後、データセットに追加する追加のデータがある場合があります。例えば、データセットに追加するインベントリデータを毎週末に受け取る場合があります。データを複数回インポートする代わりに、既存のデータセットを更新してファイルの追加や削除を行うことができます。
注記
更新できるデータセットは、ローカルアップロードまたは Amazon S3 を通じてインポートしたデータセットのみです。
データセットは手動または自動で更新できます。自動データセット更新の詳細については、「」を参照してくださいデータセットの自動更新を設定する。
データセットを更新するたびに、Canvas はデータセットの新しいバージョンを作成します。モデルの構築や予測の生成には、データセットの最新バージョンのみを使用できます。データセットのバージョン履歴の表示方法の詳細については、「データセットの詳細を表示する」を参照してください。
データセットの更新を自動バッチ予測と併用することもできます。自動バッチ予測は、データセットを更新するたびにバッチ予測ジョブを開始します。詳細については、「 SageMaker Canvas でのバッチ予測」を参照してください。
次のセクションでは、データセットを手動で更新する方法について説明します。
データセットを手動で更新する
手動で更新するには、次の手順に従います。
-
SageMaker Canvas アプリケーションを開きます。
-
左のナビゲーションペインの [Dataset] (データセット) を選択します。
-
データセットのリストで、更新するデータセットを選択します。
-
[データセットの更新] ドロップダウンメニューを選択して、[手動更新] を選択します。データのインポートワークフローが表示されます。
-
[データソース] ドロップダウンメニューで、[ローカルアップロード] または [Amazon S3] を選択します。
-
このページには、データのプレビューが表示されます。このページで、データセットへのファイルの追加、またはデータセットからのファイルの削除を行えます。表形式データをインポートする場合、新しいファイルのスキーマ (列名とデータ型) は既存のファイルのスキーマと一致する必要があります。また新しいファイルは、データセットの最大サイズまたはファイルサイズを超えることはできません。これらの制限の詳細については、「Import a dataset」を参照してください。
注記
データセット内の既存のファイルと同じ名前のファイルを追加すると、新しいファイルで古いバージョンのファイルが上書きされます。
-
変更を保存する準備ができたら、[データセットの更新] を選択します。
これで、新しいバージョンのデータセットが完成しました。
[データセット] ページで [バージョン履歴] タブを選択すると、データセットのすべてのバージョンと行った手動更新と自動更新の両方の履歴が表示されます。