本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
更新資料集
將初始資料集匯入 Amazon SageMaker Canvas 之後,您可能還有其他要新增至資料集的資料。例如,您可能會在每週結束時取得要新增至資料集的庫存資料。您可以更新現有的資料集,並在其中新增或移除檔案,而不必多次匯入資料。
注意
您只能更新透過本機上傳或 Amazon S3 匯入的資料集。
您可以手動或自動更新您的資料集。如需自動資料集更新的詳細資訊,請參閱 設定資料集的自動更新。
每次更新您的資料集時,Canvas 就會建立新版本的資料集。您只能使用最新版本的資料集來建立模型或產生預測。如需檢視資料集的版本歷史記錄的更多相關資訊,請參閱檢視資料集詳細資訊。
您也可以將資料集更新與自動批次預測搭配使用,這會在每次您更新資料集時啟動批次預測工作。如需詳細資訊,請參閱 SageMaker Canvas 中的批次預測。
下一節說明如何手動更新資料集。
手動更新資料集
若要手動更新,請執行下列動作:
-
開啟 SageMaker Canvas 應用程式。
-
在左側的導覽窗格中,選擇資料集。
-
從資料集清單中,選擇您要更新的資料集。
-
選擇更新資料集下拉式選單,然後選擇手動更新。系統會將您轉移至匯入資料工作流程。
-
從資料來源下拉式清單中選擇本機上傳或 Amazon S3。
-
此頁面會顯示資料的預覽。您可以在此處新增或移除資料集中的檔案。如果您要匯入表格式資料,則新檔案的結構描述 (欄位名稱和資料類型) 必須與現有檔案的結構描述相符。此外,您的新檔案不得超過資料集大小或檔案大小上限。如需這些限制的更多相關資訊,請參閱匯入資料集。
注意
如果您在資料集中新增與現有檔案名稱相同的檔案,則新檔案會覆寫舊版本的檔案。
-
當您準備好儲存變更時,請選擇更新資料集。
現在您應已擁有資料集的新版本。
在資料集頁面上,您可以選擇版本歷史記錄索引標籤,查看資料集的所有版本,以及您所做的手動和自動更新歷史記錄。