流行病不確定性 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

流行病不確定性

流行病不確定性是指模型的不確定性 (流行病學是知識研究),通常是由於缺乏訓練資料。流行不確定性的範例包括臉部辨識資料集中代表性不足的少數族群,或在語言建模內容中出現罕見的單字。

差異的定義會發現流行不確定性:

Mathematical equation showing the definition of variance using expectation and summation notation.

位置 Mathematical formula showing theta subscript i distributed according to pi of theta given D.

訓練模型 Mathematical notation showing the gradient of a function f with respect to theta. 的流行不確定性會隨著訓練資料大小的增加而減少。 Mathematical notation showing the gradient of a function f with respect to theta. 也可能會受到模型架構適用性的影響。因此,對機器學習工程師來說,流行不確定性的測量是非常有價值的。這是因為大型的流行不確定性指標可能表示正在對模型較不具有經驗的資料進行推論。因此,這種流行不確定性可能對應到錯誤的預測或極端值資料。