影片影格標籤工作概觀 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

影片影格標籤工作概觀

參考此頁面,了解物件偵測和物件追蹤影片影格標籤工作。本頁面上的資訊適用於這兩種內建任務類型。

由於以下原因,影片影格標籤工作是特別的工作:

  • 您可以提供準備好註釋的資料物件 (視片影格),也可以提供影片檔案,讓 Ground Truth 自動擷取影片影格。

  • 工作者可以隨時儲存工作進度。

  • 您無法使用 Amazon Mechanical Turk 人力來完成標籤任務。

  • Ground Truth 提供了一款工作者介面,以及輔助式和基本的標籤工具,協助工作者完成您的任務。您不需要提供工作者任務範本。

若要進一步了解,請參閱下列主題。

輸入資料

影片影格標籤工作會使用影片影格的序列。單一序列是從單個影片中擷取的一系列影像。您可以提供自己的影片影格序列,也可以讓 Ground Truth 自動從影片檔案中擷取影片影格序列。如需進一步了解,請參閱提供影片檔案

Ground Truth 會使用序列檔案來識別單一序列中的所有影像。您要包含在單一標籤工作中的所有序列,都會在輸入資訊清單檔案中識別。每個序列都會用來建立單一工作者任務。您可以使用 Ground Truth 自動資料設定,自動建立序列檔案和輸入資訊清單檔案。如需進一步了解,請參閱自動化影片影格輸入資料設定

若要了解如何手動建立序列檔案和輸入資訊清單檔案,請參閱建立影片影格輸入資訊清單檔案

工作完成時間

影片和影片影格標籤工作可能花費工作者數小時才能完成。當您建立標籤工作時,您可以設定工作者可花在處理每個任務的總時間。工作者花在處理任務的時間最多可設為 7 天。預設值為 3 天。

強烈建議您建立可讓工作者在 12 小時內完成的任務。工作者在處理任務時,必須保持開啟工作者使用者介面。他們可以隨時儲存工作內容,Ground Truth 每 15 分鐘會儲存一次工作。

使用 SageMaker CreateLabelingJob API 作業時,請在的TaskTimeLimitInSeconds參數中設定工作站可供 Worker 使用的總時間HumanTaskConfig

當您在主控台建立標籤工作時,您可以在選取人力資源類型和工作團隊時指定此時間限制。

任務類型

當您建立影片物件追蹤或影片物件偵測標籤工作時,您可以指定要工作者在處理標籤任務時建立的註釋類型。註釋類型將決定 Ground Truth 傳回的輸出資料類型,並定義標籤工作的任務類型

如要使用 API 作業 CreateLabelingJob 建立標籤工作,請使用標籤類別組態檔案參數 annotationType 來指定任務類型。如需進一步了解,請參閱使用標籤類別和影格屬性建立標記類別組態檔案

下列任務類型適用於影片物件追蹤或影片物件偵測標籤工作:

  • 邊界框 — 為工作者提供建立邊界框註釋的工具。邊界框是工作者在物件周圍繪製的方框,以識別影格中該物件的像素位置和標籤。

  • 折線 — 為工作者提供用來建立折線註釋的工具。折線由一系列排序的 X Y 座標定義。加入至折線的每個點均以一條線連接至上一個點。折線不一定要封閉 (起點和終點不一定要相同),而且在線之間形成的角度也無限制。

  • 多邊形 — 為工作者提供建立多邊形註釋的工具。多邊形是由一系列排序的 X Y 座標定義的封閉形狀。加入多邊形的每個點都會透過一條線連接到上一個點,而且在線之間形成的角度也無限制。多邊形的兩條線 (邊) 不能相交。多邊形的起點和終點必須相同。

  • 關鍵點 — 為工作者提供建立關鍵點註釋的工具。關鍵點是與影片影格中的 X Y 座標相關聯的單一點。

人力資源

建立影片影格標籤工作時,您需要指定負責完成註釋任務的工作團隊。您可以從您自己的工作者私有人力資源中,或從您在 AWS Marketplace中選取的廠商人力資源中,選擇工作團隊。您無法使用 Amazon Mechanical Turk 人力資源來進行影片影格標籤工作。

若要進一步了解廠商人力資源,請參閱管理廠商人力

若要了解如何建立和管理私有人力資源,請參閱使用私有人力

工作者使用者介面 (UI)

Ground Truth 提供工作者使用者介面 (UI)、工具和輔助式標籤功能,以協助工作者完成影片標籤任務。在主控台建立標籤工作時,您可以預覽工作者使用者介面。

若要使用 API 作業 CreateLabelingJob 建立標籤工作,您必須提供參數 HumanTaskUiArn 由 Ground Truth 提供的 ARN,來為您的任務類型指定工作者使用者介面。您可以搭HumanTaskUiArn配 SageMaker RenderUiTemplateAPI 作業來預覽背景工作者 UI。

您可以提供工作者指示、標籤,以及可選的屬性,工作者將藉此來提供有關標籤和影片影格的詳細資訊。這些屬性分別稱為標籤類別屬性和影格屬性。它們都會顯示在工作者使用者介面中。

標籤類別和影格屬性

建立影片物件追蹤或影片物件偵測標籤工作時,您可以新增一或多個標籤類別屬性影格屬性

  • 標籤類別屬性 — 選項清單 (字串)、任意格式文字方塊,或與一或多個標籤相關聯的數值欄位。它是由工作者用來提供有關標籤的中繼資料。

  • 影格屬性 — 顯示在工作者要註釋之每個影片影格上的選項 (字串)、任意格式文字方塊或數值欄位的清單。工作者會用來提供有關影片影格的中繼資料。

此外,您可以使用標籤和影格屬性,讓工作者驗證影片影格標籤驗證任務中的標籤。

請參閱下列各節,進一步了解這些屬性。若要了解如何將標籤類別和影格屬性新增至標籤工作,請使用您所選的任務類型頁面上的 Create Labeling Job (建立標籤工作) 區段。

標籤類別屬性

將標籤類別屬性新增至標籤,方便工作者提供有關其建立註釋的更多資訊。標籤類別屬性會新增至個別標籤或所有標籤。將標籤類別屬性套用至所有標籤時,即稱為全域標籤類別屬性

舉例來說,若您新增標籤類別 car (汽車),您也可能想要擷取所標籤汽車的更多資料,例如是否被遮住或車輛大小。您可以使用標籤類別屬性來擷取此中繼資料。在此範例中,如果您將 occluded 屬性新增至 car 標籤類別,您可能會將 partialcompletelyno 指派給 occluded 屬性,而工作者可以選取其中一個選項。

建立標籤驗證任務時,您可以將標籤類別屬性新增至您希望工作者驗證的每個標籤。

影格層級屬性

新增影格屬性,方便工作者提供個別影片影格的詳細資訊。您新增的每個影格屬性都會出現在所有影格上。

例如,您可以新增編號影格屬性,讓工作者識別他們在特定影格中看到的物件數量。

在另一個範例中,您可能希望提供任意格式文字方塊,方便工作者提供問題的答案。

建立標籤驗證任務時,您可以新增一或多個影格屬性,要求工作者針對影片影格中的所有標籤提供意見回饋。

工作者指示

您可以提供工作者指示,以協助工作者完成影片影格標籤任務。撰寫指示時,您或許需要涵蓋下列主題:

  • 提供在註釋物件時的最佳實務和避免事項。

  • 所提供的標籤類別屬性 (關於物件偵測和物件追蹤任務) 及其用法。

  • 如何在標籤時使用鍵盤快速鍵來節省時間。

您可以在建立標籤工作時使用 SageMaker 主控台新增 Worker 指示。如果您使用 API 作業 CreateLabelingJob 建立標籤工作,請在標籤類別組態檔案中指定工作者指示。

除了您的指示之外,Ground Truth 還提供連結,以協助工作者導覽和使用工作者入口網站。請在工作者指示中選取任務類型,以檢視這些指示。

拒絕任務

工作者能拒絕任務。

如果指示不清楚、輸入的資料顯示不正確,或者遇到任務的其他問題,工作者可以拒絕該任務。如果每個資料集物件 (NumberOfHumanWorkersPerDataObject) 的工作者數量拒絕任務,則資料物件會標記為已過期,且不會傳送給其他工作者。

影片影格任務權限要求

建立影片影格標籤工作時,除了指派 IAM 許可以使用 Ground Truth中列出的許可需求,您還必須將 CORS 政策新增至包含輸入資訊清單檔案的 S3 儲存貯體。

將 CORS 許可政策新增至 S3 儲存貯體

建立影片影格標籤工作時,您可以指定 S3 中的儲存貯體,其中有您的輸入資料和資訊清單檔案,也是要儲存輸出資料的地方。這些儲存貯體可能相同。您必須將下列跨來源資源分享 (CORS) 政策連接至輸入和輸出儲存貯體。如果您使用 Amazon S3 主控台,將政策新增至儲存貯體,則必須使用 JSON 格式。

JSON

[ { "AllowedHeaders": [ "*" ], "AllowedMethods": [ "GET", "HEAD", "PUT" ], "AllowedOrigins": [ "*" ], "ExposeHeaders": [ "Access-Control-Allow-Origin" ], "MaxAgeSeconds": 3000 } ]

XML

<?xml version="1.0" encoding="UTF-8"?> <CORSConfiguration xmlns="http://s3.amazonaws.com/doc/2006-03-01/"> <CORSRule> <AllowedOrigin>*</AllowedOrigin> <AllowedMethod>GET</AllowedMethod> <AllowedMethod>HEAD</AllowedMethod> <AllowedMethod>PUT</AllowedMethod> <MaxAgeSeconds>3000</MaxAgeSeconds> <ExposeHeader>Access-Control-Allow-Origin</ExposeHeader> <AllowedHeader>*</AllowedHeader> </CORSRule> </CORSConfiguration>

若要了解如何新增 CORS 政策至 S3 儲存貯體,請參閱 Amazon Simple Storage Service 使用者指南中的如何新增與 CORS 的跨網域資源共享