オブジェクト検出リクエストとレスポンスの形式

次のページでは、Amazon SageMaker AI オブジェクト検出 - MXNet モデルの推論リクエストとレスポンスの形式について説明します。

リクエストの形式

モデルのエンドポイントを使用して、トレーニング済みモデルのクエリを実行します。エンドポイントは、image/jpeg および image/png コンテンツタイプの .jpg および .png イメージ形式を使用します。

レスポンスの形式

レスポンスは、JSON 形式でエンコードされたイメージ内のすべてのオブジェクトの信頼スコアと境界ボックス座標を含むクラスインデックスです。以下は、レスポンス .json ファイルの例です。


{"prediction":[
  [4.0, 0.86419455409049988, 0.3088374733924866, 0.07030484080314636, 0.7110607028007507, 0.9345266819000244],
  [0.0, 0.73376623392105103, 0.5714187026023865, 0.40427327156066895, 0.827075183391571, 0.9712159633636475],
  [4.0, 0.32643985450267792, 0.3677481412887573, 0.034883320331573486, 0.6318609714508057, 0.5967587828636169],
  [8.0, 0.22552496790885925, 0.6152569651603699, 0.5722782611846924, 0.882301390171051, 0.8985623121261597],
  [3.0, 0.42260299175977707, 0.019305512309074402, 0.08386176824569702, 0.39093565940856934, 0.9574796557426453]
]}

この .json ファイルの各行には、検出されたオブジェクトを表す配列が含まれています。これらの各オブジェクト配列は、6 つの数字のリストで構成されています。最初の数字は予測されたクラスラベルです。2 番目の数字は、検出に関連付けられている信頼性スコアです。最後の 4 つの数字は、境界ボックスの座標 [xmin, ymin, xmax, ymax] を表します。これらの出力境界ボックスのコーナーのインデックスは、全体的なイメージサイズによって正規化されます。このエンコードは、入力 .json 形式で使用されているものとは異なることに注意してください。たとえば、検出結果の最初のエントリでは、0.3088374733924866 は境界ボックスの左座標 (左上隅の x 座標) をイメージ全体の幅に対する比率として表したもの、0.07030484080314636 は境界ボックスの上部座標 (左上隅の y 座標) をイメージ全体の高さに対する比率として表したもの、0.7110607028007507 は境界ボックスの右座標 (右下隅の x 座標) をイメージ全体の幅に対する比率として表したもの、0.9345266819000244 は境界ボックスの下部座標 (右下隅の y 座標) をイメージ全体の高さに対する比率として表したものです。

信頼性の低い検出結果を避けるために、信頼性スコアが低い検出結果を除外することをお勧めします。「object detection sample notebook」では、しきい値を使用して信頼度の低い検出を削除し、元のイメージに境界ボックスをプロットするスクリプトの例を提供しています。

バッチ変換の場合、レスポンスは JSON 形式です。この形式は上記の JSON 形式と同じです。各イメージの検出結果は JSON ファイルで表されます。例:


{"prediction": [[label_id, confidence_score, xmin, ymin, xmax, ymax], [label_id, confidence_score, xmin, ymin, xmax, ymax]]}

トレーニングと推論の詳細については、オブジェクト検出サンプルノートブックを参照してください。

出力: JSON レスポンス形式

accept: application/json;annotation=1


{
   "image_size": [
      {
         "width": 500,
         "height": 400,
         "depth": 3
      }
   ],
   "annotations": [
      {
         "class_id": 0,
         "score": 0.943,
         "left": 111,
         "top": 134,
         "width": 61,
         "height": 128
      },
      {
         "class_id": 0,
         "score": 0.0013,
         "left": 161,
         "top": 250,
         "width": 79,
         "height": 143
      },
      {
         "class_id": 1,
         "score": 0.0133,
         "left": 101,
         "top": 185,
         "width": 42,
         "height": 130
      }
   ]
}

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

モデルの調整

オブジェクト検出 - TensorFlow