认知不确定性 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

认知不确定性

认知不确定性是指模型的不确定性(认识论是对知识的研究),通常是由于缺乏训练数据所致。认知不确定性的例子包括面部识别数据集中代表性不足的少数群体,或者语言建模环境中存在罕见词语。

根据方差的定义,可以发现认识上的不确定性:

Mathematical equation showing the definition of variance using expectation and summation notation.

其中 Mathematical formula showing theta subscript i distributed according to pi of theta given D.

训练模型的认识不确定性 Mathematical notation showing the gradient of a function f with respect to theta. 将随着训练数据规模的增加而降低。 Mathematical notation showing the gradient of a function f with respect to theta. 也可能受到模型架构适用性的影响。因此,认知不确定性的衡量对机器学习工程师具有重要价值。这是因为大量的认知不确定性衡量可能表明,正在对模型经验较少的数据进行推断。因此,这种认知不确定性可能与错误预测或异常数据相对应。