Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Monte Carlo putus sekolah
Salah satu cara paling populer untuk memperkirakan ketidakpastian adalah dengan menyimpulkan distribusi prediktif dengan jaringan saraf Bayesian. Untuk menunjukkan distribusi prediktif, gunakan:

dengan target
, masukan
, dan
banyak contoh pelatihan
. Ketika Anda mendapatkan distribusi prediktif, Anda dapat memeriksa varians dan mengungkap ketidakpastian. Salah satu cara untuk mempelajari distribusi prediktif memerlukan belajar distribusi melalui fungsi, atau, setara, distribusi atas parameter (yaitu distribusi posterior parametrik
.
Teknik putus sekolah Monte Carlo (MC) (Gal dan Ghahramani 2016) menyediakan cara scalable untuk mempelajari distribusi prediktif. MC putus sekolah bekerja dengan secara acak mematikan neuron dalam jaringan saraf, yang mengatur jaringan. Setiap konfigurasi putus sekolah sesuai dengan sampel yang berbeda dari perkiraan distribusi posterior parametrik
:

di mana
sesuai dengan konfigurasi putus sekolah, atau, setara, simulasi ~, sampel dari perkiraan parametrik posterior
, seperti yang ditunjukkan pada gambar berikut. Sampling dari perkiraan posterior
memungkinkan integrasi Monte Carlo kemungkinan model, yang mengungkap distribusi prediktif, sebagai berikut:

Untuk kesederhanaan, kemungkinan dapat diasumsikan Gaussian didistribusikan:

dengan fungsi Gaussian
ditentukan oleh mean
dan varians
parameter, yang output oleh simulasi dari Monte Carlo putus sekolah BNN:

Gambar berikut mengilustrasikan MC putus sekolah. Setiap konfigurasi putus sekolah menghasilkan output yang berbeda dengan mengalihkan neuron secara acak (lingkaran abu-abu) dan pada (lingkaran hitam) dengan setiap propagasi ke depan. Beberapa forward pass dengan konfigurasi putus sekolah yang berbeda menghasilkan distribusi prediktif atas mean p (f (x, ø)).

Jumlah forward melewati data harus dievaluasi secara kuantitatif, tetapi 30-100 adalah rentang yang tepat untuk dipertimbangkan (Gal dan Ghahramani 2016).