Abandon scolaire à Monte-Carlo

L'une des méthodes les plus populaires pour estimer l'incertitude consiste à déduire des distributions prédictives à l'aide de réseaux neuronaux bayésiens. Pour indiquer une distribution prédictive, utilisez :

avec des objectifs AWS logo with "Amazon Web Services" text on a white background. , des entrées X icon, typically used to represent closing or canceling an action. et Lambda function icon with a stylized λ (lambda) symbol in orange. de nombreux exemples de formation Mathematical formula showing D as a set of pairs (x_i, y_i) from i=1 to n. . Lorsque vous obtenez une distribution prédictive, vous pouvez inspecter la variance et détecter les incertitudes. Une façon d'apprendre une distribution prédictive consiste à apprendre une distribution sur les fonctions ou, de manière équivalente, une distribution sur les paramètres (c'est-à-dire la distribution postérieure paramétrique). Mathematical formula showing p(Θ|D) with vertical bar between Θ and D.

La technique d'abandon scolaire de Monte Carlo (MC) (Gal et Ghahramani 2016) fournit un moyen évolutif d'apprendre une distribution prédictive. Le décrochage du MC fonctionne en désactivant de manière aléatoire les neurones d'un réseau neuronal, ce qui régularise le réseau. Chaque configuration d'abandon correspond à un échantillon différent de la distribution paramétrique postérieure approximative : Mathematical formula showing q(θ|D) representing a probability distribution.

où Greek letter theta subscript i, representing a mathematical variable or symbol. correspond à une configuration d'abandon, ou, de manière équivalente, à une simulation ~, échantillonnée à partir du paramètre postérieur approximatif Mathematical formula showing q(θ|D) representing a probability distribution. , comme le montre la figure suivante. L'échantillonnage à partir de la valeur postérieure approximative permet d'intégrer à Monte Carlo la vraisemblance du modèle, ce qui permet de découvrir la distribution prédictive, comme suit :

Distribution prédictive en cas d'abandon scolaire

Pour des raisons de simplicité, la probabilité peut être supposée être distribuée de Gauss :

avec la fonction gaussienne Mathematical equation showing N subscript V, representing a variable in a formula. spécifiée par les Mathematical formula showing s prime as a function of x and theta. paramètres de moyenne Mathematical function f(x, θ) with x and θ as variables. et de variance, qui sont produits par des simulations à partir du BNN, un décrocheur de Monte Carlo :

La figure suivante illustre l'abandon scolaire chez MC. Chaque configuration de décrochage produit un résultat différent en désactivant les neurones de manière aléatoire (cercles gris) et en les activant (cercles noirs) à chaque propagation vers l'avant. Plusieurs passes directes avec différentes configurations d'abandon produisent une distribution prédictive sur la moyenne p (f (x, ø)).

Le nombre de transferts directs entre les données doit être évalué quantitativement, mais 30 à 100 constituent une fourchette appropriée à prendre en compte (Gal et Ghahramani 2016).

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Échelle de température

Ensembles profonds