エンドポイントレスポンスは CSV 形式エンドポイントリクエストが JSON Lines 形式であるエンドポイントレスポンスが JSON 形式である

表形式データに対するエンドポイントレスポンス

SageMaker Clarify 処理ジョブは、推論エンドポイント呼び出しのレスポンスを受信すると、レスポンスペイロードを逆シリアル化し、そこから予測を引き出します。分析設定 accept_type パラメーターを使用して、レスポンスペイロードのデータ形式を指定します。accept_type が指定されていない場合、SageMaker Clarify 処理ジョブは content_type パラメータの値をモデル出力形式として使用します。accept_type の詳細については、「分析設定ファイル」を参照してください。

予測は、バイアス分析の予測ラベル、または特徴量重要度分析の確率値 (スコア) のいずれかで構成されます。predictor 分析設定では、次の 3 つのパラメータを使用して予測を引き出します。

パラメータ probability は、エンドポイントレスポンスの確率値 (スコア) を特定するために使用されます。
パラメータ label は、エンドポイントレスポンス内の予測ラベルを特定するために使用されます。
(オプション) パラメータ label_headers は、多クラスモデルの予測ラベルを指定します。

次のガイドラインは、CSV、JSON ライン、JSON 形式のエンドポイントレスポンスに関する説明です。

エンドポイントレスポンスは CSV 形式

レスポンスペイロードが CSV 形式 (MIME タイプ: text/csv) の場合、SageMaker Clarify 処理ジョブは各行を逆シリアル化します。次に、分析設定で提供される列インデックスを使用して、逆シリアル化されたデータから予測を引き出します。レスポンスペイロードの行は、リクエストペイロードのレコードと一致する必要があります。

次の表は、さまざまな形式とさまざまな問題タイプのレスポンスデータの例を示しています。分析設定に従って予測を引き出せれば、データはこれらの例と異なっていても問題ありません。

以下のセクションでは、CSV 形式のエンドポイントレスポンスの例を示します。

次の表は、リグレッション問題と二項分類問題に対するエンドポイントレスポンスの例です。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード。	'0.6'
2 つのレコード (結果は 1 行で、カンマで区切られます)。	'0.6,0.3'
2 つのレコード (結果は 2 行になります)。	'0.6\n0.3'

前の例では、エンドポイントは予測ラベルの単一の確率値 (スコア) を出力します。インデックスを使用して確率を抽出し、それを特徴量重要度分析に使用するには、分析設定パラメータ probability を column index 0 に設定します。これらの確率は、probability_threshold パラメータを使用してバイナリ値に変換すれば、バイアス分析にも使用できます。probability_threshold の詳細については、「分析設定ファイル」を参照してください。

次の表は、多クラス問題に対するエンドポイントレスポンスの例です。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
多クラスモデル (3 つのクラス) の 1 つのレコード。	'0.1,0.6,0.3'
多クラスモデルの 2 つのレコード (3 つのクラス)。	'0.1,0.6,0.3\n0.2,0.5,0.3'

前の例では、エンドポイントは確率 (スコア) のリストを出力します。インデックスが指定されていない場合は、すべての値が抽出され、特徴量重要度分析に使用されます。分析析設定 label_headers パラメータが指定されます。すると、SageMaker Clarify 処理ジョブは、バイアス分析に使用できる予測ラベルとして最大確率のラベルヘッダーを選択できます。label_headers の詳細については、「分析設定ファイル」を参照してください。

次の表は、リグレッション問題と二項分類問題に対するエンドポイントレスポンスの例です。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード。	'1'
2 つのレコード (結果は 1 行で、カンマで区切られます)	'1,0'
2 つのレコード (結果は 2 行になります)	'1\n0'

前の例では、エンドポイントは確率ではなく予測ラベルを出力します。predictor 設定の label パラメータを column index 0 に設定して、インデックスを使用して予測ラベルを抽出し、バイアス分析に使用できるようにします。

次の表は、リグレッション問題と二項分類問題に対するエンドポイントレスポンスの例です。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード	'1,0.6'
2 つのレコード	'1,0.6\ n 0,0.3'

前の例では、エンドポイントは確率ではなく予測ラベルとその確率を出力します。predictor 設定の label パラメータを column index 0 に設定し、probability を column index 1 に設定して両方のパラメータ値を抽出します。

Amazon SageMaker Autopilot でトレーニングした多クラスモデルは、予測ラベルと確率のリストの文字列表現を出力するように設定できます。次の表の例は、predicted_label、probability、labels、probabilities を出力するように設定されたモデルからのエンドポイントレスポンスの例を示しています。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード	'"dog",0.6,"[\'cat\', \'dog\', \'fish\']","[0.1, 0.6, 0.3]"'
2 つのレコード	'"dog",0.6,"[\'cat\', \'dog\', \'fish\']","[0.1, 0.6, 0.3]"\n""cat",0.7,[\'cat\', \'dog\', \'fish\']","[0.7, 0.2, 0.1]"'

前の例では、SageMaker Clarify 処理ジョブを以下の方法で設定して予測を引き出せます。

バイアス分析では、前の例を以下のいずれかに設定できます。

predictor 設定の label パラメータを 0 に設定して、予測ラベルを抽出します。
パラメータを 2 に設定して予測ラベルを抽出し、probability を 3 に設定すると対応する確率を抽出します。SageMaker Clarify 処理ジョブでは、確率値が最も高いラベルを識別することで、予測ラベルを自動的に決定できます。前述の単一のレコードの例を参照すると、モデルは cat、dog、fish の 3 つのラベルを対応する確率の 0.1、0.6、0.3 で予測します。これらの確率に基づいて予測ラベルは dog です。これが最も高い確率値の 0.6 を持つラベルだからです。
probability を 3 に設定して確率を抽出します。label_headers が指定されている場合、SageMaker Clarify 処理ジョブでは、確率値が最も高いラベルヘッダーを識別することによって、予測ラベルを自動的に決定できます。

特徴量重要度分析では、前の例を以下のように設定できます。

probability を 3 に設定して、すべての予測ラベルの確率を抽出します。すると、すべてのラベルの特徴量属性が計算されます。顧客が label_headers を指定しない場合、予測ラベルは分析レポートのラベルヘッダーとして使用されます。

エンドポイントリクエストが JSON Lines 形式である

レスポンスペイロードが JSON Lines 形式 (MIME タイプ: application/jsonlines) の場合、SageMaker Clarify 処理ジョブは各行を JSON として逆シリアル化します。次に、分析設定で提供される JMESPath 式を使用して、逆シリアル化されたデータから予測を引き出します。レスポンスペイロードの行は、リクエストペイロードのレコードと一致する必要があります。次の表は、さまざまな形式のレスポンスデータの例を示しています。分析設定に従って予測を引き出せれば、データはこれらの例と異なっていても問題ありません。

以下のセクションでは、JSON Lines 形式のエンドポイントレスポンスの例を示します。

次の表は、確率値 (スコア) のみを出力するエンドポイントレスポンスの例です。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード	'{"score":0.6}'
2 つのレコード	'{"score":0.6}\n{"score":0.3}'

前の例では、分析設定パラメータ probability を JMESPath 式 "score" に設定して値を抽出しました。

次の表は、予測ラベルのみを出力するエンドポイントレスポンスの例です。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード	'{"prediction":1}'
2 つのレコード	'{"prediction":1}\n{"prediction":0}'

前の例で、予測子設定の label パラメータを JMESPath 式の prediction に設定します。すると、SageMaker Clarify 処理ジョブは予測ラベルを抽出してバイアス分析を行うことができます。詳細については、「分析設定ファイル」を参照してください。

次の表は、予測ラベルとそのスコアを出力するエンドポイントレスポンスの例です。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード	'{"prediction":1,"score":0.6}'
2 つのレコード	'{"prediction":1,"score":0.6}\n{"prediction":0,"score":0.3}'

前の例で、predictor 設定の label パラメータを JMESPath 式の "prediction" に設定して、予測ラベルを抽出します。probability を JMESPath 式 "score" に設定して確率を抽出します。詳細については、「分析設定ファイル」を参照してください。

次の表は、以下を出力する多クラスモデルからのエンドポイントレスポンスの例です。

予測ラベルのリスト。
確率、選択した予測ラベルとその確率。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード	'{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]}'
2 つのレコード	'{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]}\n{"predicted_label":"cat","probability":0.7,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.7,0.2,0.1]}'

前の例では、予測を引き出すために SageMaker Clarify 処理ジョブをいくつかの方法で設定できます。

バイアス分析では、前の例を以下のいずれかに設定できます。

predictor 設定の label パラメータを JMESPath 式 "predicted_label" に設定して、予測ラベルを抽出します。
パラメータを JMESPath 式 "predicted_label" に設定して、予測ラベルを抽出します。probability を JMESPath 式 "probabilities" に設定して確率を抽出します。SageMaker Clarify ジョブでは、確率値が最も高いラベルを識別することで、予測ラベルを自動的に決定します。
probability を JMESPath 式 "probabilities" に設定して確率を抽出します。label_headers が指定されている場合、SageMaker Clarify 処理ジョブでは、確率値が最も高いラベルを識別することによって、予測ラベルを自動的に決定できます。

特徴量重要度分析を行うには、次の操作を行います。

probability を JMESPath 式 "probabilities" に設定して、すべての予測ラベルの確率を抽出します。すると、すべてのラベルの特徴量属性が計算されます。

エンドポイントレスポンスが JSON 形式である

レスポンスペイロードが JSON 形式 (MIME タイプ: application/json) の場合、SageMaker Clarify 処理ジョブはペイロード全体を JSON として逆シリアル化します。次に、分析設定で指定された JMESPath 式を使用して、逆シリアル化されたデータから予測を引き出します。レスポンスペイロードのレコードは、リクエストペイロードのレコードと一致する必要があります。

以下のセクションでは、JSON 形式のエンドポイントレスポンスの例を示します。このセクションには、さまざまな形式とさまざまな問題タイプのレスポンスデータの例を示す表が含まれています。分析設定に従って予測を引き出せれば、データはこれらの例と異なっていても問題ありません。

次の表は、確率値 (スコア) のみを出力するエンドポイントレスポンスの例です。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード	'[0.6]'
2 つのレコード	'[0.6,0.3]'

前の例では、レスポンスペイロードに改行はありません。代わりに、1 つの JSON オブジェクトには、リクエスト内の各レコードに 1 つ、スコアのリストが含まれています。分析設定パラメータ probability を JMESPath 式 "[*]" に設定して値を抽出します。

次の表は、予測ラベルのみを出力するエンドポイントからのレスポンスの例です。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード	'{"predicted_labels":[1]}'
2 つのレコード	'{"predicted_labels":[1,0]}'

predictor 設定の label パラメータを JMESPath 式 "predicted_labels" に設定すると、SageMaker Clarify 処理ジョブが予測ラベルを抽出してバイアス分析を行うことができます。

次の表は、予測ラベルとそのスコアを出力するエンドポイントからのレスポンスの例です。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード	'{"predictions":[{"ラベル":1,"スコア":0.6}'
2 つのレコード	‘{"predictions":[{"ラベル":1,"スコア":0.6},{"ラベル":0,"スコア":0.3}]}'

前の例で、predictor 設定の label パラメータを JMESPath 式の "predictions[*].score" に設定して、予測ラベルを抽出します。probability を JMESPath 式 "predictions[*].score" に設定して確率を抽出します。

次の表は、以下を出力する多クラスモデルのエンドポイントからのレスポンスの例です。

予測ラベルのリスト。
確率、選択した予測ラベルとその確率。

エンドポイントリクエストペイロード	エンドポイントレスポンスペイロード (文字列表現)
単一レコード	'[{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]}]'
2 つのレコード	'[{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]},{"predicted_label":"cat","probability":0.7,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.7,0.2,0.1]}]'

SageMaker Clarify 処理ジョブは、予測を引き出すいくつかの方法で設定できます。

バイアス分析では、前の例を以下のいずれかに設定できます。

predictor 設定の label パラメータを JMESPath 式 "[*].predicted_label" に設定して、予測ラベルを抽出します。
パラメータを JMESPath 式 "[*].predicted_labels" に設定して、予測ラベルを抽出します。probability を JMESPath 式 "[*].probabilities" に設定して確率を抽出します。SageMaker Clarify 処理ジョブでは、近接値が最も高いラベルを識別することで、予測ラベルを自動的に決定できます。
probability を JMESPath 式 "[*].probabilities" に設定して確率を抽出します。label_headers が指定されている場合、SageMaker Clarify 処理ジョブでは、確率値が最も高いラベルを識別することによって、予測ラベルを自動的に決定できます。

特徴量重要度分析では、probability を JMESPath 式 "[*].probabilities" に設定すると、すべての予測ラベルの確率を抽出できます。すると、すべてのラベルの特徴量属性が計算されます。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

表形式データに対するエンドポイントリクエスト

エンドポイントのリクエストとレスポンスの表形式データを事前に確認する