非对称 Shapley 值 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

非对称 Shapley 值

Cl SageMaker arify 时间序列预测模型解释解决方案是一种植根于合作博弈论的特征归因方法,在精神上与 SHAP 类似。具体而言,Clari fy 使用随机顺序组值,在机器学习和可解释性中也称为非对称 Shapley 值

背景

目标是计算给定预测模型 f 的输入特征的归因。预测模型采用以下输入:

  • 过去的时间序列(目标 TS)例如,这可能是巴黎-柏林路线上的每日火车乘客,用 x 表示。t

  • (可选)协变量时间序列。例如,这可能是庆祝活动和天气数据,用 z t R S 表示。使用时,协变量 TS 只能用于过去的时间步长,也可用于未来的时间步长(包含在节日日历中)。

  • (可选)静态协变量,例如服务质量(如一等舱或二等舱),用 u R E 表示

根据具体的应用场景,可以省略静态协变量、动态协变量或两者兼而有之。给定预测范围 K ≥ 0(例如 K=30 天),模型预测可以用以下公式来表征:f (x[1:T], z[1:T+K], u) = x。[T+1:T +K+1]

下图显示了典型预测模型的依赖结构。时间 t+1 的预测取决于前面提到的三种输入类型。

典型预测模型的依赖结构。

方法

解释是通过查询由原始输入得出的一系列点上的时间序列模型 f 来计算的。遵循博弈论结构,通过迭代混淆部分输入(即设置为基线值),Clarify 平均预测的差异。时间结构可以按时间顺序或反时间顺序导航,也可以两者兼而有之。按时间顺序排列的解释是通过迭代添加第一步的信息来构建的,而从最后一步开始则是反时间顺序的。在存在近期偏差的情况下,例如在预测股票价格时,后一种模式可能更合适。计算出的解释的一个重要特性是,如果模型提供确定性输出,则它们与原始模型输出相加。

由此产生的归因

生成的归因是标记特定时间步长或输入要素对每个预测时间步长的最终预测的个人贡献的分数。Clarify 提供了以下两个粒度来进行解释:

  • Timewise 解释成本低廉,仅提供有关特定时间步长的信息,例如过去第 19 天的信息对未来第 1 天的预测有多大贡献。这些归因不能单独解释静态协变量以及目标和协变量时间序列的汇总解释。归因是矩阵 A,其中每个 A tk 都是时间步长 t 对预测时间步长 t +k 的归因。请注意,如果模型接受 future 协变量,则 t 可以大于 T。

  • 细粒度解释的计算密集度更高,并且可以对输入变量的所有属性进行全面细分。

    注意

    细粒度的解释仅支持按时间顺序排列。

    由此产生的属性是一个由以下内容组成的三元组:

    • 矩阵 A x R T×K 与输入时间序列相关,其中 A tk x 是 x t 对预测步骤 t+k 的归因

    • 张量 A z r T+K×S×K 与协变量时间序列相关,其中 A tsk z 是 z ts​(即协变量 TS)对预测步骤 t+k 的归因

    • 矩阵 A u r E×K 与静态协变量有关,其中 A ek u 是 u e(eth 静态协变量)对预测步骤 t+k 的归因

不管粒度如何,解释中还包含一个偏移向量 B R K,该向量表示对所有数据进行混淆处理时模型的 “基本行为”。