批次預測 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

批次預測

當您擁有要產生預測的整個資料集時,請進行批次預測。

您可以使用兩種類型的批次預測:

  • 手動批次預測是指您有要進行一次性預測的資料集時。

  • 自動批次預測是當您設定組態,每次更新特定資料集都會執行批次預測時。例如,如果您已為庫存資料的 SageMaker Canvas 資料集設定了每週更新,則可以設定每次更新資料集時執行的自動批次預測。設定自動批次預測工作流程後,請參閱以管理自動化取得有關檢視和編輯組態詳細資訊的更多相關資訊。如需設定自動資料集更新的更多相關資訊,請參閱設定資料集的自動更新

注意

您僅可針對透過本機上傳或 Amazon S3 匯入的資料集設定自動批次預測。此外,自動批次預測只會在您登入 Canvas 應用程式時執行。如果您登出 Canvas,則重新登入時會繼續自動批次預測工作。

若要開始使用,請參閱下一節以瞭解批次預測資料集需求,然後選擇下列其中一個手動或自動批次預測工作流程。

批次預測資料集需求

針對批次預測,請確定您的資料集符合建立資料集中所述的需求。

您可能無法對某些資料集進行預測,因為它們具有不相容的結構描述結構描述是一種組織結構。針對表格式資料集,結構描述是資料欄的名稱和資料欄中資料的資料類型。不相容的結構描述可能的發生原因如下:

  • 您用來進行預測的資料集具有的資料欄少於您用來建立模型的資料集。

  • 您用來建立資料集的資料欄資料類型,可能與您用來進行預測的資料集中的資料類型不同。

  • 您用來進行預測的資料集,以及用來建置模型的資料集中資料欄名稱不相符。欄位名稱區分大小寫,Column1 不同於 column1

為了確保您可以成功產生批次預測,請比對批次預測資料集的結構描述與用於訓練模型的資料集。

注意

針對批次預測,如果您在建置模型時捨棄任何欄,Canvas 會將捨棄的欄新增回預測結果。但是,Canvas 不會將刪除的資料欄新增至時間序列模型的批次預測中。

進行手動批次預測

基於您的模型類型,選擇下列其中一個程序用於手動批次預測。

使用數值、分類和時間序列預測模型進行手動批次預測

若要針對數值、分類和時間序列預測模型類型進行手動批次預測,請執行下列動作:

  1. 在 Canvas 應用程式左側導覽窗格中選擇 My models (我的模型)。

  2. My models (我的模型) 頁面中,選擇您的模型。

  3. 開啟模型後,選擇 Predict (預測) 分頁標籤。

  4. Run predictions (執行預測) 頁面上,選擇 Batch prediction (批次預測)。

  5. 選擇 [選取資料集] 以挑選資料集以產生預測。

  6. 從可用資料集清單中選取您的資料集,然後選擇 [開始預測] 以取得您的預測。

預測工作完成執行後,[預] 區段的同一頁面上會列出一個輸出資料集。此資料集包含您的結果,且如果您選取了 More options (更多選項) 圖示 ( ),則您可以選擇 Preview (預覽) 來預覽輸出資料。您可以看到與預測相符的輸入資料以及預測正確的機率。然後您可以選擇 Download prediction (下載預測) 並將結果下載檔案。

使用影像預測模型進行手動批次預測

若要針對單一標籤影像預測模型進行手動批次預測,請執行下列動作:

  1. 在 Canvas 應用程式左側導覽窗格中選擇 My models (我的模型)。

  2. My models (我的模型) 頁面中,選擇您的模型。

  3. 開啟模型後,選擇 Predict (預測) 分頁標籤。

  4. Run predictions (執行預測) 頁面上,選擇 Batch prediction (批次預測)。

  5. 如果您已匯入您的資料集,請選擇 Select dataset (選取資料集)。如果沒有,請選擇 Import new dataset (匯入新的資料集),然後系統將導引您完成匯入資料工作流程。

  6. 從可用資料集清單中,選取您的資料集,然後選擇 Generate predictions (產生預測) 以取得您的預測。

預測工作完成執行後,在 Run predictions (執行預測) 頁面上,您會看到 Predictions (預測) 下方列出的輸出資料集。此資料集包含您的結果,且如果您選取了 More options (更多選項) 圖示 ( ),則您可以選擇 View prediction results (檢視預測結果) 來檢視輸出資料。您可以檢視影像及其預測的標籤和可信度分數。然後您可以選擇 Download prediction (下載預測) 將結果下載為 CSV 或 ZIP 檔案。

使用文字預測模型進行手動批次預測

若要針對多類別文字預測模型進行手動批次預測,請執行下列動作:

  1. 在 Canvas 應用程式左側導覽窗格中選擇 My models (我的模型)。

  2. My models (我的模型) 頁面中,選擇您的模型。

  3. 開啟模型後,選擇 Predict (預測) 分頁標籤。

  4. Run predictions (執行預測) 頁面上,選擇 Batch prediction (批次預測)。

  5. 如果您已匯入您的資料集,請選擇 Select dataset (選取資料集)。如果沒有,請選擇 Import new dataset (匯入新的資料集),然後系統將導引您完成匯入資料工作流程。您選擇的資料集必須具有與建立模型時所使用的資料集相同的來源資料欄。

  6. 從可用資料集清單中,選取您的資料集,然後選擇 Generate predictions (產生預測) 以取得您的預測。

預測工作完成執行後,在 Run predictions (執行預測) 頁面上,您會看到 Predictions (預測) 下方列出的輸出資料集。此資料集包含您的結果,且如果您選取了 More options (更多選項) 圖示 ( ),則您可以選擇 Preview (預覽) 來檢視輸出資料。您可以檢視影像及其預測的標籤和可信度分數。然後您可以選擇 Download prediction (下載預測) 來下載結果。

進行自動批次預測

若要設定自動批次預測的排程,請執行以下動作:

  1. 在 Canvas 左側導覽窗格中選擇 My Models (我的模型)。

  2. 選擇您的模型。

  3. 選擇 Predict (預測) 標籤。

  4. 選擇 Batch prediction (批次預測)。

  5. 針對 Generate predictions (產生預測),選擇 Automatic (自動)。

  6. Automate batch predictions (自動批次預測) 對話方塊隨即彈出。選擇 Select dataset (選取資料集),然後選擇您要自動執行預測的資料集。請注意,您只能選取透過本機上傳或 Amazon S3 匯入的資料集。

  7. 選取資料集之後,請選擇 Set up (設定)。

Canvas 在您設定組態之後,會針對資料集執行批次預測工作。然後,每當您更新資料集時,會手動或自動執行另一個批次預測工作。

預測工作完成執行後,在 Run predictions (執行預測) 頁面上,您會看到 Predictions (預測) 下方列出的輸出資料集。此資料集包含您的結果,且如果您選取了 More options (更多選項) 圖示 ( ),則您可以選擇 Preview (預覽) 來預覽輸出資料。您可以看到與預測相符的輸入資料以及預測正確的機率。然後,您可以選擇 Download (下載) 資源下載結果。

以下各節描述如何透過 Canvas 應用程式中的 Datasets (資料集) 頁面檢視、更新及刪除自動批次預測組態。您最多只能在 Canvas 中設定 20 個自動組態。如需透過 Canvas 應用程式中的 Automations (自動化) 頁面檢視自動更新批次預測作業歷史記錄或變更自動更新組態的更多相關資訊,請參閱 管理自動化

檢視自動批次預測工作

若要檢視自動批次預測的作業歷史記錄,請前往模型的 Predict (預測) 標籤。

每個自動批次預測工作都會顯示在模型的 Predict (預測) 索引標籤中。在 Predictions (預測) 下,您可以看到 All jobs (所有工作) 索引標籤和 Configuration (組態) 索引標籤:

  • All jobs (所有工作) - 在此標籤中,您可以查看此模型的所有批次預測工作。您可以依組態名稱篩選工作。針對於每個工作,您可以看到諸如 Input dataset (輸入資料集) 之類的欄位,其中包括資料集的版本以及 Prediction type (預測類型),例如預測是自動還是手動預測。如果您選擇 More options (更多選項) 圖示 ( ),則可以選擇 View prediction (檢視預測) 或 Download prediction (下載預測)。

  • Configuration (組態) - 在此索引標籤中,您可以檢視為此模型建立的所有自動批次預測組態。針對每個組態,您都可以看到例如 Created (建立) 時間戳記、追蹤更新的 Input dataset (輸入資料集),以及 Next job scheduled (排程的下一個工作) 等欄位。如果您選擇 More options (更多選項) 圖示 ( ),您可以選擇 View all jobs (檢視所有工作)來查看組態的作業歷史記錄和進行中的工作。

編輯自動批次預測設定

您可能想要變更資料集的自動更新組態,例如變更更新頻率。您也可能希望關閉自動更新組態,以暫停資料集的更新。

當您編輯批次預測設定時,您可以變更目標資料集,但無法變更頻率 (因為每當資料集更新時,都會自動進行批次預測)。

若要編輯自動更新組態,請執行下列動作:

  1. 前往模型的 Predict (預測) 索引標籤。

  2. Predictions (預測) 下,選擇 Configuration (組態) 索引標籤。

  3. 尋找您的組態並選擇 More options (更多選項) 圖示 ( )。

  4. 從下拉式清單功能表選擇 Update configuration (更新組態)。

  5. Automate batch prediction (自動批次預測) 對話方塊隨即彈出。您可以選取其他資料集,然後選擇 Set up (設定) 以儲存變更。

您的自動批次預測設定現已更新。

若要暫停自動批次預測,請執行下列動作來關閉自動設定:

  1. 前往模型的 Predict (預測) 索引標籤。

  2. Predictions (預測) 下,選擇 Configuration (組態) 索引標籤。

  3. 從清單中尋找您的組態,然後關閉 Auto update (自動更新) 切換開關。

自動批次預測現已暫停。您可以隨時重新開啟切換,以繼續更新排程。

刪除自動批次預測設定

若要了解如何刪除自動批次預測設定,請參閱 刪除自動組態

您也可以刪除組態,請執行下列動作:

  1. 前往模型的 Predict (預測) 索引標籤。

  2. Predictions (預測) 下,選擇 Configuration (組態) 索引標籤。

  3. 從清單中尋找您的組態並選擇 More options (更多選項) 圖示 ( )。

  4. 從下拉式清單功能表選擇 Delete configuration (刪除組態)。

您的組態現在應該已刪除。