建立資料集 - Amazon Lookout for Vision

支援終止通知:在 2025 年 10 月 31 日, AWS 將停止對 Amazon Lookout for Vision 的支援。2025 年 10 月 31 日之後,您將無法再存取 Lookout for Vision 主控台或 Lookout for Vision 資源。如需詳細資訊,請造訪此部落格文章

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立資料集

資料集包含您用來訓練和測試模型的影像和指派標籤。您可以使用 Amazon Lookout for Vision 主控台或 CreateDataset 操作來建立專案的資料集。資料集影像必須根據您要建立的模型類型 (影像分類或影像分割) 進行標記。

準備資料集的影像

您需要影像集合才能建立資料集。您的映像必須是 PNG 或 JPEG 格式檔案。您需要的影像數量和類型取決於您的專案是否具有單一資料集或單獨的訓練和測試資料集。

單一資料集專案

若要建立映像分類模型,您需要下列項目才能開始訓練:

  • 至少 20 張正常物件的影像。

  • 至少 10 個異常物件的影像。

若要建立影像分割模型,您需要下列項目才能開始訓練:

  • 每個異常類型至少 20 個影像。

  • 每個異常影像 (存在異常類型的影像) 只能有一種異常類型。

  • 至少 20 張正常物件的影像。

個別的訓練和測試資料集專案

若要建立映像分類模型,您需要下列項目:

  • 訓練資料集中至少 10 個正常物件的影像。

  • 測試資料集中至少 10 張正常物件的影像。

  • 測試資料集中至少 10 個異常物件的影像。

若要建立影像分割模型,您需要下列項目:

  • 每個資料集至少需要每個異常類型的 10 個影像。

  • 每個異常影像 (存在異常類型的影像) 只能包含一種異常類型。

  • 每個資料集必須至少有 10 個正常物件的影像。

若要建立更高品質的模型,請使用超過最低數量的影像。如果您正在建立分割模型,我們建議您包含具有多種異常類型的映像,但這些不計入 Lookout for Vision 開始訓練所需的最低值。

您的映像應該是單一類型的物件。此外,您應該有一致的影像擷取條件,例如攝影機定位、照明和物件姿勢。

訓練和測試資料集中的所有影像都必須具有相同的維度。稍後,您使用訓練模型分析的影像必須具有與訓練和測試資料集影像相同的維度。如需詳細資訊,請參閱偵測映像中的異常

所有訓練和測試映像必須是唯一的映像,最好是唯一的物件。正常影像應擷取正在分析之物件的正常變化。異常影像應擷取各種異常取樣。

Amazon Lookout for Vision 提供您可以使用的範例映像。如需詳細資訊,請參閱影像分類資料集

如需影像限制,請參閱 亞馬遜視覺瞭望中的配額

建立資料集

當您為專案建立資料集時,您可以選擇專案的初始資料集組態。您也可以選擇 Lookout for Vision 從中匯入影像的位置。

為您的專案選擇資料集組態

當您在專案中建立第一個資料集時,您可以選擇下列其中一個資料集組態:

  • 單一資料集 – 單一資料集專案使用單一資料集來訓練和測試模型。使用單一資料集可讓 Amazon Lookout for Vision 選擇訓練和測試映像,以簡化訓練。在訓練期間,Amazon Lookout for Vision 會在內部將資料集分割為訓練資料集和測試資料集。您無法存取分割資料集。我們建議在大多數情況下使用單一資料集專案。

  • 個別的訓練和測試資料集 – 如果您想要更精確地控制訓練、測試和效能調校,您可以將專案設定為具有個別的訓練和測試資料集。如果您想要控制用於測試的映像,或者如果您已經有您想要使用的一組基準映像,請使用單獨的測試資料集。

您可以將測試資料集新增至現有的單一資料集專案。單一資料集接著會變成訓練資料集。如果您從具有個別訓練和測試資料集的專案中移除測試資料集,則專案會成為單一資料集專案。如需詳細資訊,請參閱刪除資料集

匯入映像

建立資料集時,您可以選擇從何處匯入映像。視您匯入影像的方式而定,影像可能已加上標籤。如果建立資料集後未標記影像,請參閱 標記檔案

您可以建立資料集,並以下列其中一種方式匯入其映像:

  • 從本機電腦匯入映像。影像不會加上標籤。您可以使用 Lookout for Vision 主控台新增或標記。

  • 從 S3 儲存貯體匯入映像。Amazon Lookout for Vision 可以使用資料夾名稱來標記影像,藉此分類影像。將 normal用於一般影像。anomaly 用於異常影像。您無法自動指派分割標籤。

  • 匯入 Amazon SageMaker AI Ground Truth 資訊清單檔案,其中包含標籤影像。您可以建立和匯入自己的資訊清單檔案。如果您有許多影像,請考慮使用 SageMaker AI Ground Truth 標籤服務。然後,您可以從 Amazon SageMaker AI Ground Truth 任務匯入輸出資訊清單檔案。如有必要,您可以使用 Lookout for Vision 主控台來新增或變更標籤。

如果您使用 AWS SDK,請使用 Amazon SageMaker AI Ground Truth 資訊清單檔案建立資料集。如需詳細資訊,請參閱使用 Amazon SageMaker AI Ground Truth 資訊清單檔案建立資料集

如果在建立資料集後,您的映像會加上標籤,您可以訓練模型。如果未標記影像,請根據您要建立的模型類型新增標籤。如需詳細資訊,請參閱標記檔案

您可以將更多映像新增至現有的資料集。如需詳細資訊,請參閱將映像新增至資料集