建立資料集 - Amazon Lookout for Vision

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立資料集

資料集包含您用來訓練和測試模型的影像和指派的標籤。您可以使用適用於視覺的 Amazon Lookout 主控台或使用CreateDataset作業建立專案的資料集。資料集影像必須根據您要建立的模型類型加上標籤 (影像分類或影像分割)。

為資料集準備影像

您需要一組影像才能建立資料集。您的圖像必須是PNG或JPEG格式化文件。您需要的影像數量和類型取決於您的專案是否有單一資料集,還是單獨的訓練和測試資料集。

單一資料集專案

若要建立映像分類模型,您需要下列項目才能開始訓練:

  • 普通對象的至少 20 圖像。

  • 至少 10 個異常物體的圖像。

若要建立影像分割模型,您需要下列項目才能開始訓練:

  • 每種異常類型至少 20 張圖像。

  • 每個異常影像 (存在異常類型的影像) 必須只有一種異常類型。

  • 普通對象的至少 20 圖像。

獨立的訓練和測試資料集專案

若要建立影像分類模型,您需要下列項目:

  • 訓練資料集中至少有 10 個一般物件的影像。

  • 測試資料集中至少有 10 個一般物件的影像。

  • 測試資料集中至少 10 個異常物件的影像。

若要建立影像分割模型,您需要下列項目:

  • 每個資料集至少需要 10 個每種異常類型的影像。

  • 每個異常影像 (存在異常類型的影像) 只能包含一種異常類型。

  • 每個資料集必須至少有 10 個一般物件的影像。

若要建立較高品質的模型,請使用大於最小數目的影像。如果您要建立區段模型,我們建議您加入具有多種異常類型的影像,但這些影像不會計入 Lookout for Vision 開始訓練所需的最低限度。

您的圖像應該是單一類型的對象。此外,您應該擁有一致的影像拍攝條件,例如相機定位、照明和物件姿勢。

訓練和測試資料集中的所有影像都必須具有相同的維度。稍後,您使用訓練的模型分析的影像必須具有與訓練和測試資料集影像相同的維度。如需詳細資訊,請參閱偵測影像中的異常

所有訓練和測試影像都必須是唯一的影像,最好是獨特的物件。一般影像應該會擷取被分析物件的正常變化。異常影像應擷取異常的多樣化取樣。

Amazon 視覺瞭望提供您可以使用的示例圖像。如需詳細資訊,請參閱影像分類資料集

如需影像限制,請參閱亞馬遜視覺瞭望中的配額

建立資料集

當您為專案建立資料集時,您可以選擇專案的初始資料集設定。您還可以選擇「Lookout for Vision」從中導入圖像的位置。

選擇專案的資料集設定

當您在專案中建立第一個資料集時,請選擇下列其中一個資料集設定:

  • 單一資料集 — 單一資料集專案使用單一資料集來訓練和測試您的模型。使用單一資料集可讓 Amazon Lookout for Vision 選擇訓練和測試影像,以簡化訓練。在訓練期間,Amazon Lookout for Vision 會將資料集內部分割為訓練資料集和測試資料集。您無法存取分割的資料集。我們建議在大多數情況下使用單一資料集專案。

  • 單獨的訓練和測試資料集 — 如果您想要更精細地控制訓練、測試和效能調整,您可以將專案設定為具有獨立的訓練和測試資料集。如果您想要控制用於測試的影像,或者您已經有一組要使用的基準測試影像,請使用個別的測試資料集。

您可以將測試資料集新增至現有的單一資料集專案。然後,單一資料集會成為訓練資料集。如果您從具有不同訓練和測試資料集的專案中移除測試資料集,該專案就會變成單一資料集專案。如需詳細資訊,請參閱刪除資料集

匯入影像

建立資料集時,您可以選擇從何處匯入影像。視您匯入影像的方式而定,影像可能已經加上標籤。如果影像在建立資料集之後沒有標示,請參閱標記檔案

您可以使用下列其中一種方式建立資料集並匯入其影像:

  • 從本機電腦匯入影像。圖像沒有標記。您可以使用 Lookout for Vision 控制台添加或標籤。

  • 從 S3 儲存貯體匯入映像。Amazon Lookout for Vision 察可以通過使用文件夾名稱來標記圖像進行分類。用normal於一般影像。用anomaly於異常影像。您無法自動指派區段標籤。

  • 導入 Amazon SageMaker Ground Truth 清單文件,其中包括標記的圖像。您可以創建和導入自己的清單文件。如果您有很多圖像,請考慮使用 SageMaker Ground Truth 標籤服務。然後,您可以從 Amazon SageMaker Ground Truth 工作匯入輸出資訊清單檔案。如有必要,您可以使用 LoLookout for Vision 主控台來新增或變更標籤。

如果您正在使用 AWS SDK,您建立具有 Amazon SageMaker Ground Truth 資訊清單檔案的資料集。如需詳細資訊,請參閱使用 Amazon SageMaker Ground Truth 清單文件創建數據集

如果在建立資料集之後,您的影像已加上標籤,您可以訓練模型。如果圖像沒有標記,請根據您要創建的模型類型添加標籤。如需詳細資訊,請參閱標記檔案

您可以將更多影像新增至現有的資料集。如需詳細資訊,請參閱將影像新增至資料集