翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
表形式データに対するエンドポイントレスポンス
SageMaker Clarify 処理ジョブは、推論エンドポイント呼び出しのレスポンスを受信すると、レスポンスペイロードを逆シリアル化し、そこから予測を引き出します。分析設定 accept_type
パラメーターを使用して、レスポンスペイロードのデータ形式を指定します。accept_type
が指定されていない場合、SageMaker Clarify 処理ジョブは content_type パラメータの値をモデル出力形式として使用します。accept_type
の詳細については、「分析設定ファイル」を参照してください。
予測は、バイアス分析の予測ラベル、または特徴量重要度分析の確率値 (スコア) のいずれかで構成されます。predictor
分析設定では、次の 3 つのパラメータを使用して予測を引き出します。
-
パラメータ
probability
は、エンドポイントレスポンスの確率値 (スコア) を特定するために使用されます。 -
パラメータ
label
は、エンドポイントレスポンス内の予測ラベルを特定するために使用されます。 -
(オプション) パラメータ
label_headers
は、多クラスモデルの予測ラベルを指定します。
次のガイドラインは、CSV、JSON ライン、JSON 形式のエンドポイントレスポンスに関する説明です。
エンドポイントレスポンスは CSV 形式
レスポンスペイロードが CSV 形式 (MIME タイプ: text/csv
) の場合、SageMaker Clarify 処理ジョブは各行を 逆シリアル化します。次に、分析設定で提供される列インデックスを使用して、逆シリアル化されたデータから予測を引き出します。レスポンスペイロードの行は、リクエストペイロードのレコードと一致する必要があります。
次の表は、さまざまな形式とさまざまな問題タイプのレスポンスデータの例を示しています。分析設定に従って予測を引き出せれば、データはこれらの例と異なっていても問題ありません。
以下のセクションでは、CSV 形式のエンドポイントレスポンスの例を示します。
次の表は、リグレッション問題と二項分類問題に対するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード。 |
'0.6' |
2 つのレコード (結果は 1 行で、カンマで区切られます)。 |
'0.6,0.3' |
2 つのレコード (結果は 2 行になります)。 |
'0.6\n0.3' |
前の例では、エンドポイントは予測ラベルの単一の確率値 (スコア) を出力します。インデックスを使用して確率を抽出し、それを特徴量重要度分析に使用するには、分析設定パラメータ probability
を column index 0
に設定します。これらの確率は、probability_threshold
パラメータを使用してバイナリ値に変換すれば、バイアス分析にも使用できます。probability_threshold
の詳細については、「分析設定ファイル」を参照してください。
次の表は、多クラス問題に対するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
多クラスモデル (3 つのクラス) の 1 つのレコード。 |
'0.1,0.6,0.3' |
多クラスモデルの 2 つのレコード (3 つのクラス)。 |
'0.1,0.6,0.3\n0.2,0.5,0.3' |
前の例では、エンドポイントは確率 (スコア) のリストを出力します。インデックスが指定されていない場合は、すべての値が抽出され、特徴量重要度分析に使用されます。分析析設定 label_headers
パラメータが指定されます。すると、SageMaker Clarify 処理ジョブは、バイアス分析に使用できる予測ラベルとして最大確率のラベルヘッダーを選択できます。label_headers
の詳細については、「分析設定ファイル」を参照してください。
次の表は、リグレッション問題と二項分類問題に対するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード。 |
'1' |
2 つのレコード (結果は 1 行で、カンマで区切られます) |
'1,0' |
2 つのレコード (結果は 2 行になります) |
'1\n0' |
前の例では、エンドポイントは確率ではなく予測ラベルを出力します。predictor
設定の label
パラメータを column index 0
に設定して、インデックスを使用して予測ラベルを抽出し、バイアス分析に使用できるようにします。
次の表は、リグレッション問題と二項分類問題に対するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'1,0.6' |
2 つのレコード |
'1,0.6\ n 0,0.3' |
前の例では、エンドポイントは確率ではなく予測ラベルとその確率を出力します。predictor
設定の label
パラメータを column index 0
に設定し、probability
を column index 1
に設定して両方のパラメータ値を抽出します。
Amazon SageMaker Autopilot でトレーニングした多クラスモデルは、予測ラベルと確率のリストの文字列表現を出力するように設定できます。次の表の例は、predicted_label
、probability
、labels
、probabilities
を出力するように設定されたモデルからのエンドポイントレスポンスの例を示しています。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'"dog",0.6,"[\'cat\', \'dog\', \'fish\']","[0.1, 0.6, 0.3]"' |
2 つのレコード |
'"dog",0.6,"[\'cat\', \'dog\', \'fish\']","[0.1, 0.6, 0.3]"\n""cat",0.7,[\'cat\', \'dog\', \'fish\']","[0.7, 0.2, 0.1]"' |
前の例では、SageMaker Clarify 処理ジョブを以下の方法で設定して予測を引き出せます。
バイアス分析では、前の例を以下のいずれかに設定できます。
-
predictor
設定のlabel
パラメータを0
に設定して、予測ラベルを抽出します。 -
パラメータを
2
に設定して予測ラベルを抽出し、probability
を3
に設定すると対応する確率を抽出します。SageMaker Clarify 処理ジョブでは、確率値が最も高いラベルを識別することで、予測ラベルを自動的に決定できます。前述の単一のレコードの例を参照すると、モデルはcat
、dog
、fish
の 3 つのラベルを対応する確率の0.1
、0.6
、0.3
で予測します。これらの確率に基づいて予測ラベルはdog
です。これが最も高い確率値の0.6
を持つラベルだからです。 -
probability
を3
に設定して確率を抽出します。label_headers
が指定されている場合、SageMaker Clarify 処理ジョブでは、確率値が最も高いラベルヘッダーを識別することによって、予測ラベルを自動的に決定できます。
特徴量重要度分析では、前の例を以下のように設定できます。
-
probability
を3
に設定して、すべての予測ラベルの確率を抽出します。すると、すべてのラベルの特徴量属性が計算されます。顧客がlabel_headers
を指定しない場合、予測ラベルは分析レポートのラベルヘッダーとして使用されます。
エンドポイントリクエストが JSON Lines 形式である
レスポンスペイロードが JSON Lines 形式 (MIME タイプ: application/jsonlines
) の場合、SageMaker Clarify 処理ジョブは各行を JSON として逆シリアル化します。次に、分析設定で提供される JMESPath 式を使用して、逆シリアル化されたデータから予測を引き出します。レスポンスペイロードの行は、リクエストペイロードのレコードと一致する必要があります。次の表は、さまざまな形式のレスポンスデータの例を示しています。分析設定に従って予測を引き出せれば、データはこれらの例と異なっていても問題ありません。
以下のセクションでは、JSON Lines 形式のエンドポイントレスポンスの例を示します。
次の表は、確率値 (スコア) のみを出力するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"score":0.6}' |
2 つのレコード |
'{"score":0.6}\n{"score":0.3}' |
前の例では、分析設定パラメータ probability
を JMESPath 式 "score" に設定して値を抽出しました。
次の表は、予測ラベルのみを出力するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"prediction":1}' |
2 つのレコード |
'{"prediction":1}\n{"prediction":0}' |
前の例で、予測子設定の label
パラメータを JMESPath 式の prediction
に設定します。すると、SageMaker Clarify 処理ジョブは予測ラベルを抽出してバイアス分析を行うことができます。詳細については、「分析設定ファイル」を参照してください。
次の表は、予測ラベルとそのスコアを出力するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"prediction":1,"score":0.6}' |
2 つのレコード |
'{"prediction":1,"score":0.6}\n{"prediction":0,"score":0.3}' |
前の例で、predictor
設定の label
パラメータを JMESPath 式の "prediction" に設定して、予測ラベルを抽出します。probability
を JMESPath 式 "score" に設定して確率を抽出します。詳細については、「分析設定ファイル」を参照してください。
次の表は、以下を出力する多クラスモデルからのエンドポイントレスポンスの例です。
-
予測ラベルのリスト。
-
確率、選択した予測ラベルとその確率。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]}' |
2 つのレコード |
'{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]}\n{"predicted_label":"cat","probability":0.7,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.7,0.2,0.1]}' |
前の例では、予測を引き出すために SageMaker Clarify 処理ジョブをいくつかの方法で設定できます。
バイアス分析では、前の例を以下のいずれかに設定できます。
-
predictor
設定のlabel
パラメータを JMESPath 式 "predicted_label" に設定して、予測ラベルを抽出します。 -
パラメータを JMESPath 式 "predicted_label" に設定して、予測ラベルを抽出します。
probability
を JMESPath 式 "probabilities" に設定して確率を抽出します。SageMaker Clarify ジョブでは、確率値が最も高いラベルを識別することで、予測ラベルを自動的に決定します。 -
probability
を JMESPath 式 "probabilities" に設定して確率を抽出します。label_headers
が指定されている場合、SageMaker Clarify 処理ジョブでは、確率値が最も高いラベルを識別することによって、予測ラベルを自動的に決定できます。
特徴量重要度分析を行うには、次の操作を行います。
-
probability
を JMESPath 式 "probabilities" に設定して、すべての予測ラベルの確率を抽出します。すると、すべてのラベルの特徴量属性が計算されます。
エンドポイントレスポンスが JSON 形式である
レスポンスペイロードが JSON 形式 (MIME タイプ: application/json
) の場合、SageMaker Clarify 処理ジョブはペイロード全体を JSON として逆シリアル化します。次に、分析設定で指定された JMESPath 式を使用して、逆シリアル化されたデータから予測を引き出します。レスポンスペイロードのレコードは、リクエストペイロードのレコードと一致する必要があります。
以下のセクションでは、JSON 形式のエンドポイントレスポンスの例を示します。このセクションには、さまざまな形式とさまざまな問題タイプのレスポンスデータの例を示す表が含まれています。分析設定に従って予測を引き出せれば、データはこれらの例と異なっていても問題ありません。
次の表は、確率値 (スコア) のみを出力するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'[0.6]' |
2 つのレコード |
'[0.6,0.3]' |
前の例では、レスポンスペイロードに改行はありません。代わりに、1 つの JSON オブジェクトには、リクエスト内の各レコードに 1 つ、スコアのリストが含まれています。分析設定パラメータ probability
を JMESPath 式 "[*]" に設定して値を抽出します。
次の表は、予測ラベルのみを出力するエンドポイントからのレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"predicted_labels":[1]}' |
2 つのレコード |
'{"predicted_labels":[1,0]}' |
predictor
設定の label
パラメータを JMESPath 式 "predicted_labels" に設定すると、SageMaker Clarify 処理ジョブが予測ラベルを抽出してバイアス分析を行うことができます。
次の表は、予測ラベルとそのスコアを出力するエンドポイントからのレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"predictions":[{"ラベル":1,"スコア":0.6}' |
2 つのレコード |
‘{"predictions":[{"ラベル":1,"スコア":0.6},{"ラベル":0,"スコア":0.3}]}' |
前の例で、predictor
設定の label
パラメータを JMESPath 式の "predictions[*].score" に設定して、予測ラベルを抽出します。probability
を JMESPath 式 "predictions[*].score" に設定して確率を抽出します。
次の表は、以下を出力する多クラスモデルのエンドポイントからのレスポンスの例です。
-
予測ラベルのリスト。
-
確率、選択した予測ラベルとその確率。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'[{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]}]' |
2 つのレコード |
'[{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]},{"predicted_label":"cat","probability":0.7,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.7,0.2,0.1]}]' |
SageMaker Clarify 処理ジョブは、予測を引き出すいくつかの方法で設定できます。
バイアス分析では、前の例を以下のいずれかに設定できます。
-
predictor
設定のlabel
パラメータを JMESPath 式 "[*].predicted_label" に設定して、予測ラベルを抽出します。 -
パラメータを JMESPath 式 "[*].predicted_labels" に設定して、予測ラベルを抽出します。
probability
を JMESPath 式 "[*].probabilities" に設定して確率を抽出します。SageMaker Clarify 処理ジョブでは、近接値が最も高いラベルを識別することで、予測ラベルを自動的に決定できます。 -
probability
を JMESPath 式 "[*].probabilities" に設定して確率を抽出します。label_headers
が指定されている場合、SageMaker Clarify 処理ジョブでは、確率値が最も高いラベルを識別することによって、予測ラベルを自動的に決定できます。
特徴量重要度分析では、probability
を JMESPath 式 "[*].probabilities" に設定すると、すべての予測ラベルの確率を抽出できます。すると、すべてのラベルの特徴量属性が計算されます。