Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Temperaturskalierung
Wir haben den Durchschnitt von fünf verschiedenen Werten genommen und einen Wert von T = 2,62 für verschiedene Trainingssamen erhalten. Die folgenden Diagramme zeigen die Kalibrierung vor und nach der Temperaturskalierung. Wie das erste Diagramm zeigt, wiesen unskalierte Softmax-Werte große Abweichungen auf. Beispielsweise enthält das Konfidenzintervall von 70 bis 80% Prognosen, die zu weniger als 50% genau sind. Nach der Skalierung verbessert sich die Kalibrierung erheblich. Beispielsweise entspricht ein Bereich von 70 bis 80% einer Genauigkeit von 72% Folglich haben wir die temperaturskalierten Werte für nachfolgende Experimente verwendet.
