Monte Carlo dropout

Una de las formas más populares de estimar la incertidumbre es inferir distribuciones predictivas con redes neuronales bayesianas. Para indicar una distribución predictiva, utilice:

con objetivos AWS logo with "Amazon Web Services" text on a white background. , aportaciones X icon, typically used to represent closing or canceling an action. y Lambda function icon with a stylized λ (lambda) symbol in orange. muchos ejemplos de formación Mathematical formula showing D as a set of pairs (x_i, y_i) from i=1 to n. . Cuando obtiene una distribución predictiva, puede inspeccionar la varianza y descubrir la incertidumbre. Una forma de conocer una distribución predictiva requiere aprender una distribución entre funciones o, de manera equivalente, una distribución sobre los parámetros (es decir, la distribución paramétrica posterior) Mathematical formula showing p(Θ|D) with vertical bar between Θ and D. .

La técnica de abandono de Montecarlo (MC) (Gal y Ghahramani, 2016) proporciona una forma escalable de aprender una distribución predictiva. El MC dropout funciona apagando aleatoriamente las neuronas de una red neuronal, lo que regulariza la red. Cada configuración de abandono corresponde a una muestra diferente de la distribución posterior paramétrica aproximada: Mathematical formula showing q(θ|D) representing a probability distribution.

donde Greek letter theta subscript i, representing a mathematical variable or symbol. corresponde a una configuración de abandono o, de manera equivalente, a una simulación ~, muestreada a partir de la parte posterior paramétrica aproximada Mathematical formula showing q(θ|D) representing a probability distribution. , como se muestra en la siguiente figura. El muestreo de la parte posterior aproximada permite integrar en Montecarlo la probabilidad del modelo, lo que permite descubrir la distribución predictiva, de la siguiente manera:

Distribución predictiva en el MC dropout

Para simplificar, se puede suponer que la probabilidad tiene una distribución gaussiana:

con la función gaussiana Mathematical equation showing N subscript V, representing a variable in a formula. especificada mediante los Mathematical formula showing s prime as a function of x and theta. parámetros de media y varianza Mathematical function f(x, θ) with x and θ as variables. , que se obtienen mediante simulaciones del BNN de Monte Carlo dropout:

El siguiente gráfico muestra el MC dropout Cada configuración de exclusión produce una salida diferente al apagar y encender las neuronas de forma aleatoria (círculos grises) y encenderlas (círculos negros) con cada propagación hacia delante. Múltiples pasadas hacia adelante con diferentes configuraciones de abandono producen una distribución predictiva sobre la media p (f (x, ø)).

El número de pases anticipados a los datos debe evaluarse cuantitativamente, pero entre 30 y 100 es un rango adecuado a tener en cuenta (Gal y Ghahramani 2016).

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Escalado de temperatura

Conjuntos profundos