清單檔案中的物件本地化 - Rekognition

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

清單檔案中的物件本地化

您可以將「 SageMakerGround Truth 邊界方框 Job 輸出」格式 JSON 行新增至資訊清單檔案,匯入標有物件當地語系化資訊的影像。

本地化資訊代表物件在影像上的位置。位置由圍繞物件的週框方塊表示。週框方塊結構包含週框方塊的左上角座標,以及週框方塊的寬度和高度。週框方塊格式 JSON Line 包含影像上一或多個物件位置的週框方塊,以及影像上每個物件的類別。

清單檔案由一或多個 JSON Lines 組成,每行包含單一影像的資訊。

建立物件本地化的清單檔案
  1. 建立空白文字檔案。

  2. 針對要匯入的每個影像新增 JSON Line。每個 JSON Line 應該看起來類似下列內容。

    {"source-ref": "s3://bucket/images/IMG_1186.png", "bounding-box": {"image_size": [{"width": 640, "height": 480, "depth": 3}], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101}, {"class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334}]}, "bounding-box-metadata": {"objects": [{ "confidence": 1}, {"confidence": 1}], "class-map": {"0": "Echo", "1": "Echo Dot"}, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job"}}
  3. 儲存檔案。您可以使用副檔名 .manifest,但這不是必要的。

  4. 使用您剛建立的檔案建立資料集。如需詳細資訊,請參閱 若要使用 SageMaker Ground Truth 格式資訊清單檔案 (主控台) 建立資料集

物件週框方塊 JSON Lines

在本區段中,我們會說明如何為單一影像建立 JSON Line。下列影像即顯示 Amazon Echo 和 Amazon Echo Dot 裝置周圍的週框方塊。

以下是上一個影像的週框方塊 JSON Line。

{ "source-ref": "s3://custom-labels-bucket/images/IMG_1186.png", "bounding-box": { "image_size": [{ "width": 640, "height": 480, "depth": 3 }], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101 }, { "class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334 }] }, "bounding-box-metadata": { "objects": [{ "confidence": 1 }, { "confidence": 1 }], "class-map": { "0": "Echo", "1": "Echo Dot" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job" } }

記下以下資訊。

source-ref

(必要) 影像的 Amazon S3 位置。格式是 "s3://BUCKET/OBJECT_PATH"。匯入資料集中的影像必須存放在同一個 Amazon S3 儲存貯體中。

bounding-box

(必要) 屬性標籤。您可以選擇欄位名稱。包含在影像中偵測到的每個物件的影像大小和週框方塊。必須有由欄位名稱識別的對應中繼資料,並附加了 -metadata。例如 "bounding-box-metadata"

image_size

(必要) 包含以像素為單位之影像大小的單一元素陣列。

  • height — (必要) 以像素為單位的影像高度。

  • width — (必要) 以像素為單位的影像深度。

  • depth — (必要) 影像中的頻道數。若為 RGB 影像,值為 3。Amazon Rekognition 自訂標籤未使用,但需要一個值。

註釋

(必要) 影像中偵測到的每個物件的週框方塊資訊陣列。

  • class_id — (必要) 對應至 class-map 中的標籤。在前面的範例中,class_id1 的物件是影像中的 Echo Dot。

  • top — (必要) 從影像頂端到週框方塊頂端的距離,以像素為單位。

  • left — (必要) 從影像左側到週框方塊左側的距離,以像素為單位。

  • width — (必要) 以像素為單位的週框方塊寬度。

  • height — (必要) 以像素為單位的週框方塊高度。

bounding-box-metadata

(必要) 有關標籤屬性的中繼資料。欄位名稱必須與附加了 -metadata 的標籤屬性相同。影像中偵測到的每個物件的週框方塊資訊陣列。

物件

(必要) 影像中的物件陣列。對應至註釋陣列 (依索引)。Amazon Rekognition 自訂標籤不使用可信度屬性。

class-map

(必要) 套用至影像中偵測到之物件的類別的對應。

type

(必要) 分類任務的類型。"groundtruth/object-detection" 將任務識別為物件偵測。

creation-date

(必要) 建立標籤時的國際標準時間 (UTC) 日期和時間。

human-annotated

(必要) 如果註釋由人類完成,則指定 "yes"。否則為 "no"

job-name

(必要) 處理影像的任務的名稱。