オブジェクト検出リクエストとレスポンスの形式 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

オブジェクト検出リクエストとレスポンスの形式

次のページでは、Amazon SageMaker Object Detection - MXNetモデルの推論リクエストとレスポンス形式について説明します。

リクエストの形式

モデルのエンドポイントを使用して、トレーニング済みモデルのクエリを実行します。エンドポイントは、image/jpeg および image/png コンテンツタイプの .jpg および .png イメージ形式を使用します。

レスポンスの形式

レスポンスは、 JSON 形式でエンコードされたイメージ内のすべてのオブジェクトの信頼スコアと境界ボックス座標を持つクラスインデックスです。以下は、レスポンス .json ファイルの例です。

{"prediction":[ [4.0, 0.86419455409049988, 0.3088374733924866, 0.07030484080314636, 0.7110607028007507, 0.9345266819000244], [0.0, 0.73376623392105103, 0.5714187026023865, 0.40427327156066895, 0.827075183391571, 0.9712159633636475], [4.0, 0.32643985450267792, 0.3677481412887573, 0.034883320331573486, 0.6318609714508057, 0.5967587828636169], [8.0, 0.22552496790885925, 0.6152569651603699, 0.5722782611846924, 0.882301390171051, 0.8985623121261597], [3.0, 0.42260299175977707, 0.019305512309074402, 0.08386176824569702, 0.39093565940856934, 0.9574796557426453] ]}

この .json ファイルの各行には、検出されたオブジェクトを表す配列が含まれています。これらの各オブジェクト配列は、6 つの数字のリストで構成されています。最初の数字は予測されたクラスラベルです。2 番目の数字は、検出に関連付けられている信頼性スコアです。最後の 4 つの数字は、境界ボックスの座標 [xmin, ymin, xmax, ymax] を表します。これらの出力境界ボックスのコーナーのインデックスは、全体的なイメージサイズによって正規化されます。このエンコードは、入力 .json 形式で使用されているものとは異なることに注意してください。たとえば、検出結果の最初のエントリでは、0.3088374733924866 は境界ボックスの左座標 (左上隅の x 座標) をイメージ全体の幅に対する比率として表したもの、0.07030484080314636 は境界ボックスの上部座標 (左上隅の y 座標) をイメージ全体の高さに対する比率として表したもの、0.7110607028007507 は境界ボックスの右座標 (右下隅の x 座標) をイメージ全体の幅に対する比率として表したもの、0.9345266819000244 は境界ボックスの下部座標 (右下隅の y 座標) をイメージ全体の高さに対する比率として表したものです。

信頼性の低い検出結果を避けるために、信頼性スコアが低い検出結果を除外することをお勧めします。「object detection sample notebook」では、しきい値を使用して信頼度の低い検出を削除し、元のイメージに境界ボックスをプロットするスクリプトの例を提供しています。

バッチ変換の場合、レスポンスは JSON 形式で、 形式は上記のJSON形式と同じです。各イメージの検出結果は JSON ファイルとして表されます。例:

{"prediction": [[label_id, confidence_score, xmin, ymin, xmax, ymax], [label_id, confidence_score, xmin, ymin, xmax, ymax]]}

トレーニングと推論の詳細については、オブジェクト検出サンプルノートブックを参照してください。

OUTPUT: JSONレスポンス形式

accept: application/json;annotation=1

{ "image_size": [ { "width": 500, "height": 400, "depth": 3 } ], "annotations": [ { "class_id": 0, "score": 0.943, "left": 111, "top": 134, "width": 61, "height": 128 }, { "class_id": 0, "score": 0.0013, "left": 161, "top": 250, "width": 79, "height": 143 }, { "class_id": 1, "score": 0.0133, "left": 101, "top": 185, "width": 42, "height": 130 } ] }