Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Penskalaan suhu
Kami mengambil rata-rata lima nilai yang berbeda, mendapatkan nilaiT= 2.62 di seluruh benih pelatihan yang berbeda. Grafik berikut menunjukkan kalibrasi sebelum dan sesudah penskalaan suhu. Sebagai grafik pertama menunjukkan, nilai softmax unscaled mengungkapkan perbedaan besar. Misalnya, bucket kepercayaan 70-80% berisi prediksi yang kurang dari 50% akurat. Setelah penskalaan, kalibrasi meningkat secara substansial. Misalnya, ember 70-80% sesuai dengan akurasi 72%. Akibatnya, kami menggunakan nilai skala suhu untuk eksperimen berikutnya.
