Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwenden Sie SageMaker integrierte Amazon-Algorithmen oder vortrainierte Modelle
Amazon SageMaker bietet eine Reihe integrierter Algorithmen, vortrainierter Modelle und vorgefertigter Lösungsvorlagen, um Datenwissenschaftlern und Machine-Learning-Experten den schnellen Einstieg in die Schulung und Implementierung von Modellen für maschinelles Lernen zu erleichtern. Für jemanden, der mit dem Thema noch nicht vertraut istSageMaker, kann die Auswahl des richtigen Algorithmus für Ihren speziellen Anwendungsfall eine schwierige Aufgabe sein. Die folgende Tabelle enthält einen kurzen Spickzettel, der zeigt, wie Sie mit einem Beispielproblem oder Anwendungsfall beginnen und einen geeigneten integrierten Algorithmus finden können, der für SageMaker diesen Problemtyp gültig ist. Zusätzliche Anleitungen, die nach Lernparadigmen (beaufsichtigt und unbeaufsichtigt) und wichtigen Datenbereichen (Text und Bilder) geordnet sind, finden Sie in den Abschnitten nach der Tabelle.
Tabelle: Zuordnung von Anwendungsfällen zu integrierten Algorithmen | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Beispielprobleme und Anwendungsfälle | Lernparadigma oder -domäne | Arten von Problemen | Dateneingabeformat | Eingebaute Algorithmen | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Hier einige Beispiele der 15 Problemtypen, die mit den vortrainierten Modellen und vorgefertigten Lösungsvorlagen behandelt werden können, die bereitgestellt werden von: SageMaker JumpStart Beantwortung von Fragen: Chatbot, der eine Antwort auf eine bestimmte Frage ausgibt. Textanalyse: Analysieren Sie Texte aus Modellen, die für einen Branchenbereich wie das Finanzwesen spezifisch sind. |
Vortrainierte Modelle und vorgefertigte Lösungsvorlagen |
Bildklassifizierung Tabellarische Gliederung Tabellarische Regression Textklassifizierung Objekterkennung Texteinbettung Beantwortung von Fragen Satzpaar-Klassifizierung Einbetten von Bildern Named Entity Recognition Instanzsegmentierung Textgenerierung Zusammenfassung des Textes Semantische Segmentierung Machine Translation |
Bild, Text, Tabellarisch | Beliebte Modelle, darunter Mobilenet, YOLO, Faster R-CNN, BERT, LightGBM und CatBoost Eine Liste der verfügbaren vortrainierten Modelle finden Sie unter JumpStartModelle. Eine Liste der verfügbaren vorgefertigten Lösungsvorlagen finden Sie unter JumpStartLösungen. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sagen Sie voraus, ob ein Artikel zu einer Kategorie gehört: einem E-Mail-Spamfilter |
Binär-/Mehrklassen-Klassifizierung |
Tabellarisch |
AutoGluon-Tabellarisch, CatBoost, Factorization Machines-Algorithmus, K-nearest neighbors (k-NN)-Algorithmus, Leichtes GBM, Algorithmus für lineares Lernen, TabTransformer, XGBoost-Algorithmus |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Einen numerischen/kontinuierlichen Wert vorhersagen: Schätzen Sie den Wert eines Hauses |
Regression |
Tabellarisch |
AutoGluon-Tabellarisch, CatBoost, Factorization Machines-Algorithmus, K-nearest neighbors (k-NN)-Algorithmus, Leichtes GBM, Algorithmus für lineares Lernen, TabTransformer, XGBoost-Algorithmus |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Prognostizieren Sie future Verhalten auf der Grundlage historischer Daten für ein Verhalten: prognostizieren Sie Verkäufe für ein neues Produkt auf der Grundlage früherer Verkaufsdaten. |
Zeitreihenprognosen |
Tabellarisch | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Verbessern Sie die Dateneinbettung der hochdimensionalen Objekte: Identifizieren Sie doppelte Support-Tickets oder finden Sie das richtige Routing auf der Grundlage der Textähnlichkeit in den Tickets |
Einbettungen: konvertieren hochdimensionale Objekte in niedrigdimensionale Räume. | Tabellarisch | Object2Vec-Algorithmus | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Löschen Sie die Spalten aus einem Datensatz, die eine schwache Beziehung zur Label-/Zielvariablen haben: der Farbe eines Autos, wenn dessen Kilometerstand vorhergesagt wird. |
Unüberwachtes Learning- |
Feature-Engineering: Reduzierung der Dimensionalität |
Tabellarisch |
Algorithmus für die Hauptkomponentenanalyse (Principal Component Analysis, PCA) |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Erkennen Sie abnormales Verhalten in der Anwendung: Erkennen Sie, wenn ein IoT-Sensor abnormale Messwerte sendet |
Anomalieerkennung |
Tabellarisch | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Schützen Sie Ihre Anwendung vor verdächtigen Benutzern: Ermitteln Sie, ob eine IP-Adresse, die auf einen Dienst zugreift, von einem böswilligen Akteur stammen könnte |
IP-Anomalieerkennung |
Tabellarisch | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Gruppieren Sie ähnliche Objekte/Daten: Suchen Sie anhand ihrer Transaktionshistorie nach Kunden mit hohen, mittleren und niedrigen Ausgaben |
Clustering oder Gruppierung |
Tabellarisch | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ordnen Sie eine Reihe von Dokumenten in Themen ein (die im Voraus nicht bekannt sind): Kennzeichnen Sie ein Dokument anhand der im Dokument verwendeten Begriffe als zu einer medizinischen Kategorie gehörend. |
Themenmodellierung |
Text |
Latent Dirichlet Allocation (LDA)-Algorithmus, Algorithmus für neuronale Themenmodellierung (NTM) |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ordnen Sie Dokumenten in einem Korpus vordefinierte Kategorien zu: Kategorisieren Sie Bücher in einer Bibliothek nach wissenschaftlichen Disziplinen |
Textklassifizierung |
Text | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Text von einer Sprache in eine andere umwandeln: Spanisch in Englisch |
Machine Übersetzung Algorithmus |
Text | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Fassen Sie einen Langtextkorpus zusammen: eine Zusammenfassung für eine Forschungsarbeit |
Zusammenfassung des Textes |
Text | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Audiodateien in Text konvertieren: Telefongespräche zur weiteren Analyse transkribieren |
S peech-to-text |
Text | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ein Bild anhand des Bildinhalts beschriften/taggen: Warnmeldungen über Inhalte für Erwachsene in einem Bild |
Verarbeiten von Bildern |
Klassifizierung von Bildern und mehreren Labels |
Image | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Klassifizieren Sie etwas in einem Bild mithilfe von Transfer Learning. |
Bildklassifizierung | Image | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Personen und Gegenstände auf einem Bild erkennen: Polizei überprüft eine große Fotostrecke nach einer vermissten Person |
Objekterkennung und Klassifizierung |
Image | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Taggen Sie jedes Pixel eines Bildes einzeln mit einer Kategorie: Selbstfahrende Autos bereiten sich darauf vor, Objekte zu identifizieren, die ihnen im Weg stehen |
Machine Vision |
Image |
Wichtige Informationen zu Docker-Registrierungspfaden, Datenformaten, empfohlenen Amazon EC2 EC2-Instance-Typen und CloudWatch Protokollen, die allen integrierten Algorithmen von gemeinsam sind, finden Sie unterSageMaker. Allgemeine Informationen zu integrierten Algorithmen
Die folgenden Abschnitte enthalten zusätzliche Anleitungen für die in Amazon SageMaker integrierten Algorithmen, gruppiert nach den Paradigmen des überwachten und unüberwachten Lernens, zu denen sie gehören. Eine Beschreibung dieser Lernparadigmen und der damit verbundenen Problemtypen finden Sie unterAuswählen eines Algorithmus. Es werden auch Abschnitte für die SageMaker integrierten Algorithmen bereitgestellt, die für zwei wichtige Bereiche des maschinellen Lernens verfügbar sind: Textanalyse und Bildverarbeitung.
Vorgefertigte Modelle und Lösungsvorlagen
SageMakerJumpStartbietet eine breite Palette von vortrainierten Modellen, vorgefertigten Lösungsvorlagen und Beispielen für gängige Problemtypen, die sowohl das SageMaker SDK als auch Studio verwenden. Weitere Informationen zu diesen Modellen, Lösungen und den Beispiel-Notebooks von finden Sie SageMaker JumpStart unterSageMaker JumpStart.
Betreutes Lernen
Amazon SageMaker bietet mehrere integrierte Allzweckalgorithmen, die entweder für Klassifizierungs- oder Regressionsprobleme verwendet werden können.
-
AutoGluon-Tabellarisch— ein Open-Source-AutoML-Framework, das erfolgreich ist, indem es Modelle zusammenfügt und sie in mehreren Ebenen stapelt.
-
CatBoost—eine Implementierung des Gradient-Boosted-Trees-Algorithmus, der Order-Boosting einführt, und einen innovativen Algorithmus zur Verarbeitung kategorischer Merkmale.
-
Factorization Machines-Algorithmus—eine Erweiterung eines linearen Modells, das entwickelt wurde, um Interaktionen zwischen Merkmalen in hochdimensionalen, spärlichen Datensätzen wirtschaftlich zu erfassen.
-
K-nearest neighbors (k-NN)-Algorithmus—eine nichtparametrische Methode, bei der die k nächstgelegenen beschrifteten Punkte verwendet werden, um einem neuen Datenpunkt zur Klassifizierung eine Bezeichnung oder für die Regression einen prognostizierten Zielwert aus dem Durchschnitt der k nächstgelegenen Punkte zuzuweisen.
-
Leichtes GBM—eine Implementierung des Gradient-Boosted Trees-Algorithmus, der zwei neuartige Techniken für verbesserte Effizienz und Skalierbarkeit hinzufügt: Gradient-Based One-Side Sampling (GOSS) und Exclusive Feature Bundling (EFB).
-
Algorithmus für lineares Lernen—erlernt eine lineare Funktion für die Regression oder eine lineare Schwellenfunktion für die Klassifizierung.
-
TabTransformer—eine neuartige Architektur für tiefe tabellarische Datenmodellierung, die auf self-attention-based Transformers basiert.
-
XGBoost-Algorithmus—eine Implementierung des Gradient-Boosted-Trees-Algorithmus, der eine Reihe von Schätzungen aus einer Reihe einfacherer und schwächerer Modelle kombiniert.
Amazon bietet SageMaker auch mehrere integrierte Algorithmen für überwachtes Lernen, die für speziellere Aufgaben beim Feature-Engineering und der Prognose anhand von Zeitreihendaten verwendet werden.
-
Object2Vec-Algorithmus—ein neuer, hochgradig anpassbarer Mehrzweckalgorithmus, der für das Feature-Engineering verwendet wird. Es kann niedrigdimensionale, dichte Einbettungen hochdimensionaler Objekte erlernen, um Funktionen zu erzeugen, die die Trainingseffizienz für Downstream-Modelle verbessern. Dies ist zwar ein überwachter Algorithmus, da er beschriftete Daten für das Training benötigt, aber es gibt viele Szenarien, in denen die Beziehungsbezeichnungen ausschließlich aus natürlichen Clustern in Daten ohne explizite menschliche Anmerkungen gewonnen werden können.
-
DeepAR-Prognosenalgorithmus—ein Algorithmus für überwachtes Lernen zur Prognose skalarer (eindimensionaler) Zeitreihen unter Verwendung wiederkehrender neuronaler Netze (RNN).
Unüberwachtes Learning-
Amazon SageMaker bietet mehrere integrierte Algorithmen, die für eine Vielzahl von unbeaufsichtigten Lernaufgaben wie Clusterbildung, Dimensionsreduzierung, Mustererkennung und Anomalieerkennung verwendet werden können.
-
Algorithmus für die Hauptkomponentenanalyse (Principal Component Analysis, PCA)— reduziert die Dimensionalität (Anzahl der Merkmale) innerhalb eines Datensatzes, indem Datenpunkte auf die ersten Hauptkomponenten projiziert werden. Ziel ist es, so viele Informationen oder Variationen wie möglich beizubehalten. Für Mathematiker sind die Hauptkomponenten Eigenvektoren der Kovarianzmatrix der Daten.
-
k-Means-Algorithmus— findet diskrete Gruppierungen innerhalb von Daten, in denen Mitglieder einer Gruppe einander so ähnlich wie möglich und unterscheiden sich so stark wie möglich von Mitgliedern anderer Gruppen.
-
IP Insights— erlernt die Nutzungsmuster für IPv4-Adressen. Er wurde entwickelt, um Zuordnungen zwischen IPv4-Adressen und verschiedenen Entitys, wie beispielsweise Benutzer-IDs oder Kontonummern, zu erfassen.
-
Random Cut Forest (RCF)-Algorithmus— erkennt anomale Datenpunkte innerhalb eines Datensatzes, die von ansonsten gut strukturierten oder gemusterten Daten abweichen.
Textanalyse
SageMakerstellt Algorithmen bereit, die auf die Analyse von Textdokumenten zugeschnitten sind, die bei der Verarbeitung natürlicher Sprache, der Klassifizierung oder Zusammenfassung von Dokumenten, der Themenmodellierung oder -klassifizierung sowie der Transkription oder Übersetzung von Sprachen verwendet werden.
-
BlazingText Algorithmus—eine hochoptimierte Implementierung der Word2Vec- und Textklassifizierungsalgorithmen, die problemlos auf große Datensätze skaliert werden können. Es ist nützlich für viele nachgeschaltete Aufgaben zur Verarbeitung natürlicher Sprache (NLP).
-
Sequence-to-Sequence-Algorithmus—ein überwachter Algorithmus, der üblicherweise für die neuronale maschinelle Übersetzung verwendet wird.
-
Latent Dirichlet Allocation (LDA)-Algorithmus—ein Algorithmus, der für die Bestimmung von Themen in einer Reihe von Dokumenten geeignet ist. Er ist ein unüberwachter Algorithmus, was bedeutet, dass während der Schulung keine Beispieldaten mit Antworten verwendet werden.
-
Algorithmus für neuronale Themenmodellierung (NTM)—eine weitere unüberwachte Technik zur Bestimmung von Themen in einer Reihe von Dokumenten, bei der ein neuronaler Netzwerkansatz verwendet wird.
-
Textklassifizierung - TensorFlow—ein überwachter Algorithmus, der Transfer-Learning mit verfügbaren vortrainierten Modellen für die Textklassifizierung unterstützt.
Verarbeiten von Bildern
SageMakerbietet auch Bildverarbeitungsalgorithmen, die für die Bildklassifizierung, Objekterkennung und Computer Vision verwendet werden.
-
Bildklassifizierung - MXNet— verwendet Beispieldaten mit Antworten (bezeichnet als überwachter Algorithmus). Verwenden Sie diesen Algorithmus zur Klassifikation von Bildern.
-
Bildklassifizierung - TensorFlow—verwendet vortrainierte TensorFlow Hub-Modelle zur Feinabstimmung auf bestimmte Aufgaben (bezeichnet als überwachter Algorithmus). Verwenden Sie diesen Algorithmus zur Klassifikation von Bildern.
-
Semantischer Segmentierungsalgorithm—bietet einen differenzierten Ansatz auf Pixelebene für die Entwicklung von Computer-Vision-Anwendungen.
-
Objekterkennung - MXNet—erkennt und klassifiziert Objekte in Bildern mithilfe eines einzigen tiefen neuronalen Netzwerks. Es handelt sich um einen überwachten Lernalgorithmus, der Bilder als Eingabe akzeptiert und alle Instances von Objekten innerhalb der Bilderszene identifiziert.
-
Objekterkennung - TensorFlow— erkennt Begrenzungsrahmen und Objektbeschriftungen in einem Bild. Es handelt sich um einen überwachten Lernalgorithmus, der Transferlernen mit verfügbaren vortrainierten TensorFlow Modellen unterstützt.
Themen
- Allgemeine Informationen zu integrierten Algorithmen
- Integrierten SageMaker Algorithmen für tabellarische Daten
- Integrierte SageMaker Algorithmen für Textdaten
- Integriert SageMaker Algorithmen für Zeitreihendaten
- Integrierte unbeaufsichtigte Funktion SageMaker Algorithm
- Integrierte SageMaker Algorithmen für Computer Vision