非対称シャプリー値 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

非対称シャプリー値

SageMaker Clarify 時系列予測モデルの説明ソリューションは、協調ゲーム理論 に根ざした特徴属性メソッドであり、 の精神に似ていますSHAP。具体的には、Clarify はランダムな順序のグループ値 を使用します。これは、機械学習と説明可能性の非対称シャプリー値とも呼ばれます。

背景

目標は、特定の予測モデル f への入力特徴量の属性を計算することです。予測モデルでは、次の入力が使用されます。

  • 過去の時系列 (ターゲット TS)。例えば、これは、x tで表されるパリ-ベルリンルートの毎日の列車乗客を過ぎている可能性があります。

  • (オプション) 共変量時系列。例えば、これは zt ∈ RS で表される祭りや気象データである可能性があります。使用する場合、共変量 TS は、過去のステップまたは将来のステップ (祭りカレンダーに含まれる) でのみ使用できます。

  • (オプション) u ∈ RE で表されるサービス品質 (1 級や 2 級など) などの静的共変量。

静的な共変量、動的共変量、またはその両方は、特定のアプリケーションシナリオに応じて省略できます。予測期間 K ≥ 0 (例: K=30 日) を考慮すると、モデル予測は f(x [1:T], z [1:T+K], u) = x [T+1:T +K+1]の式によって特徴付けられます。

次の図は、一般的な予測モデルの依存関係構造を示しています。時間 t+1 での予測は、前述の 3 種類の入力によって異なります。

一般的な予測モデルの依存関係構造。

[メソッド]

説明は、元の入力によって導出された一連のポイントで時系列モデル f をクエリすることで計算されます。ゲーム理論の構築後、Clarify は入力の部分を難読化 (つまり、ベースライン値に設定) することによって導かれる予測の平均差を反復的に表します。時間構造は、時系列、反時系列、またはその両方でナビゲートできます。時系列の説明は、最初のステップからの情報を反復的に追加し、最後のステップからの反時系列で追加することで構築されます。後者のモードは、株価を予測するときなど、緊急性バイアスがある場合により適している場合があります。計算された説明の重要なプロパティの 1 つは、モデルが決定論的な出力を提供する場合、元のモデル出力に合計することです。

結果の属性

結果として生じる属性は、特定の時間ステップまたは入力機能の個々の寄与を、各予測時間ステップの最終予測にマークするスコアです。Clarify では、説明用に次の 2 つの粒度が用意されています。

  • 時間的説明は安価であり、過去の 19 日目の情報が将来の 1 日目の予測にどの程度貢献したかなど、特定の時間ステップに関する情報のみを提供します。これらの属性は、ターゲット時系列と共変量時系列の個々の静的共変量と集計説明を説明しません。属性はマトリックス A で、各 A tkは時間ステップ T+k の予測に対する時間ステップ t の属性です。モデルが将来の共変量を受け入れる場合、tT より大きい場合があることに注意してください。

  • きめ細かな説明は、計算集約的であり、入力変数のすべての属性の完全な内訳を提供します。

    注記

    きめ細かな説明は時系列のみをサポートします。

    結果として生じる属性は、以下で構成されるトリプレットです。

    • 入力時系列に関連するマトリックス Ax ∈ RT×K。A tkx は予測ステップ T+k に対する xt の属性です。

    • 共変量時系列に関連する Tensor Az ∈ RT+K×S×K。ここで、A tskz は予測ステップ T+k に対する zts​ (すなわち、sth 共変量 TS) の属性です。

    • 静的共変量に関連するマトリックス Au ∈ RE×K。ここで、A eku は予測ステップ T+k に対する ue (eth 静的共変量) の属性です。

粒度に関係なく、説明には、すべてのデータが難読化された場合のモデルの「基本的な動作」を表すオフセットベクトル B∈ RK も含まれています。