Monte Carlo dropout - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Monte Carlo dropout

Una de las formas más populares de estimar la incertidumbre es inferir distribuciones predictivas con redes neuronales bayesianas. Para indicar una distribución predictiva, utilice:

Distribución predictiva

con objetivos AWS logo with "Amazon Web Services" text on a white background. , aportaciones X icon, typically used to represent closing or canceling an action. y Lambda function icon with a stylized λ (lambda) symbol in orange. muchos ejemplos de formación Mathematical formula showing D as a set of pairs (x_i, y_i) from i=1 to n. . Cuando obtiene una distribución predictiva, puede inspeccionar la varianza y descubrir la incertidumbre. Una forma de conocer una distribución predictiva requiere aprender una distribución entre funciones o, de manera equivalente, una distribución sobre los parámetros (es decir, la distribución paramétrica posterior) Mathematical formula showing p(Θ|D) with vertical bar between Θ and D. .

La técnica de abandono de Montecarlo (MC) (Gal y Ghahramani, 2016) proporciona una forma escalable de aprender una distribución predictiva. El MC dropout funciona apagando aleatoriamente las neuronas de una red neuronal, lo que regulariza la red. Cada configuración de abandono corresponde a una muestra diferente de la distribución posterior paramétrica aproximada: Mathematical formula showing q(θ|D) representing a probability distribution.

MC dropout

donde Greek letter theta subscript i, representing a mathematical variable or symbol. corresponde a una configuración de abandono o, de manera equivalente, a una simulación ~, muestreada a partir de la parte posterior paramétrica aproximada Mathematical formula showing q(θ|D) representing a probability distribution. , como se muestra en la siguiente figura. El muestreo de la parte posterior aproximada Mathematical formula showing q(θ|D) representing a probability distribution. permite integrar en Montecarlo la probabilidad del modelo, lo que permite descubrir la distribución predictiva, de la siguiente manera:

Distribución predictiva en el MC dropout

Para simplificar, se puede suponer que la probabilidad tiene una distribución gaussiana:

Probabilidad distribuida gaussiana

con la función gaussiana Mathematical equation showing N subscript V, representing a variable in a formula. especificada mediante los Mathematical formula showing s prime as a function of x and theta. parámetros de media y varianza Mathematical function f(x, θ) with x and θ as variables. , que se obtienen mediante simulaciones del BNN de Monte Carlo dropout:

BNN MC dropout

El siguiente gráfico muestra el MC dropout Cada configuración de exclusión produce una salida diferente al apagar y encender las neuronas de forma aleatoria (círculos grises) y encenderlas (círculos negros) con cada propagación hacia delante. Múltiples pasadas hacia adelante con diferentes configuraciones de abandono producen una distribución predictiva sobre la media p (f (x, ø)).

MC dropout

El número de pases anticipados a los datos debe evaluarse cuantitativamente, pero entre 30 y 100 es un rango adecuado a tener en cuenta (Gal y Ghahramani 2016).