Quantifizierung der Unsicherheit in Deep-Learning-Systemen

Josiah Davis, Jason Zhu und Jeremy Oldfather, Amazon Web Services ()AWS

Samual MacDonald und Maciej Trzaskowski, Max Kelsen

August 2020 (Geschichte der Dokumente)

Die Bereitstellung von Lösungen für maschinelles Lernen (ML) für die Produktion ist schwierig. Es ist nicht einfach zu wissen, wo man anfangen soll, welche Tools und Techniken man verwenden sollte und ob man es richtig macht. ML-Experten verwenden je nach ihren individuellen Erfahrungen unterschiedliche Techniken oder sie verwenden vorgeschriebene Tools, die in ihrem Unternehmen entwickelt wurden. In beiden Fällen erfordern die Entscheidung, was zu tun ist, die Implementierung der Lösung und deren Wartung erhebliche Investitionen in Zeit und Ressourcen. Bestehende ML-Techniken tragen zwar dazu bei, Teile des Prozesses zu beschleunigen, aber die Integration dieser Techniken zur Bereitstellung robuster Lösungen erfordert monatelange Arbeit. Dieser Leitfaden ist der erste Teil einer Inhaltsreihe, die sich auf maschinelles Lernen konzentriert und Beispiele dafür enthält, wie Sie schnell loslegen können. Ziel der Serie ist es, Ihnen zu helfen, Ihren ML-Ansatz zu standardisieren, Designentscheidungen zu treffen und Ihre ML-Lösungen effizient bereitzustellen. In den kommenden Monaten werden wir weitere ML-Leitfäden veröffentlichen. Aktuelle Informationen finden Sie auf der AWS Prescriptive Guidance-Website.

In diesem Leitfaden werden aktuelle Techniken zur Quantifizierung und zum Umgang mit Unsicherheit in Deep-Learning-Systemen untersucht, um die prädiktive Modellierung in ML-Lösungen zu verbessern. Dieser Inhalt richtet sich an Datenwissenschaftler, Dateningenieure, Softwareingenieure und führende Datenwissenschaftler, die hochwertige, produktionsreife ML-Lösungen effizient und in großem Maßstab bereitstellen möchten. Die Informationen sind für Datenwissenschaftler relevant, unabhängig von ihrer Cloud-Umgebung oder den Amazon Web Services (AWS) -Diensten, die sie nutzen oder nutzen möchten.

In diesem Leitfaden wird vorausgesetzt, dass Sie mit einführenden Konzepten in den Bereichen Wahrscheinlichkeit und Deep Learning vertraut sind. Vorschläge zum Aufbau von Kompetenzen für maschinelles Lernen in Ihrem Unternehmen finden Sie unter Deep Learning Specialization auf der Coursera-Website oder in den Ressourcen auf der Seite Machine Learning: Data Scientist auf der Website AWS Training and Certification.

Einführung

Wenn Erfolg in der Datenwissenschaft von der Prognoseleistung unserer Modelle abhängt, ist Deep Learning mit Sicherheit ein starker Performer. Dies gilt insbesondere für Lösungen, die nichtlineare, hochdimensionale Muster aus sehr großen Datensätzen verwenden. Wenn Erfolg jedoch auch durch die Fähigkeit definiert wird, mit Unsicherheit zu argumentieren und Produktionsausfälle zu erkennen, wird die Wirksamkeit von Deep Learning fraglich. Wie quantifizieren wir Unsicherheit am besten? Wie nutzen wir diese Unsicherheiten, um Risiken zu managen? Welche Unsicherheitspathologien stellen die Zuverlässigkeit und damit die Sicherheit unserer Produkte in Frage? Und wie können wir solche Herausforderungen bewältigen?

Dieser Leitfaden:

Stellt die Motivation zur Quantifizierung von Unsicherheit in Deep-Learning-Systemen vor
Erläutert wichtige Wahrscheinlichkeitskonzepte, die sich auf Deep Learning beziehen
Demonstriert aktuelle state-of-the-art Techniken zur Quantifizierung von Unsicherheiten in Deep-Learning-Systemen und hebt die damit verbundenen Vor- und Nachteile hervor
Untersucht diese Techniken im Rahmen des Transferlernens im Rahmen der Verarbeitung natürlicher Sprache (NLP)
Bietet eine Fallstudie, die von Projekten inspiriert ist, die in einem ähnlichen Umfeld durchgeführt wurden

Wie in diesem Leitfaden beschrieben, ist es bei der Quantifizierung von Unsicherheiten beim Deep Learning eine gute Faustregel, die Temperaturskalierung bei tiefen Ensembles zu verwenden.

Die Temperaturskalierung ist ein ideales Instrument zur Interpretation von Unsicherheitsschätzungen, wenn Daten in ihrer Verteilung betrachtet werden können (Guo et al. 2017).
Umfassende Ensembles liefern state-of-the-art Schätzungen der Unsicherheit darüber, wann Daten nicht mehr verbreitet sind (Ovadia et al. 2019).

Wenn der Speicherbedarf von Hosting-Modellen ein Problem darstellt, können Sie Monte Carlo (MC) -Dropout anstelle von tiefen Ensembles verwenden. Im Fall von Transfer Learning sollten Sie erwägen, entweder MC-Dropout oder Deep-Ensembles mit MC-Dropout zu verwenden.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Konzepte im Ungewissen