翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
温度スケーリング
5 つの異なる値の平均をとり、異なるトレーニングシードで T = 2.62 の値を取得しました。以下のグラフは、温度スケーリング前と実施後のキャリブレーションを示しています。最初のグラフが示すように、スケーリングしていないソフトマックス値では大きな相違が見られました。たとえば、70 ~ 80% の信頼度バケットには、50% 未満の精度しかない予測が含まれています。スケーリングを行うと、キャリブレーションは大幅に改善されます。たとえば、70 ~ 80% のバケットは 72% の精度に相当します。そのため、その後の実験では温度スケーリングされた値を使用しました。
