Amazon SageMaker
Entwicklerhandbuch

Verwenden von integrierten Amazon SageMaker-Algorithmen

Ein Machine Learning-Algorithmus verwendet Beispieldaten, um eine allgemeine Lösung (ein Modell) zu erstellen, die sich mit der Unternehmensfrage beschäftigt, die Sie zu beantworten versuchen. Nachdem Sie mithilfe von Beispieldaten ein Modell erstellt haben, können Sie dieses verwenden, um dieselbe Unternehmensfrage für einen neuen Satz von Daten zu beantworten. Dies wird auch als das Abrufen von Inferenzen bezeichnet.

Amazon SageMaker bietet mehrere integrierte Machine Learning-Algorithmen, die Sie für eine Vielzahl von Problemarten verwenden können.

Da Sie ein Modell erstellen, um eine Unternehmensfrage zu beantworten, besteht der erste Schritt darin, das Problem, das Sie lösen möchten, zu verstehen. Insbesondere das Format der Antwort, die Sie suchen, wirkt sich auf den Algorithmus aus, den Sie auswählen. Nehmen wir beispielsweise an, Sie sind Marketingmanager einer Bank und möchten eine Direct-Mailing-Kampagne durchführen, um neue Kunden zu gewinnen. Überlegen Sie sich, nach welchen möglichen Arten von Antworten Sie suchen:

  • Antworten, die in diskrete Kategorien passen – beispielsweise Antworten auf folgende Fragen:

     

    • "Sollte ich, basierend auf früheren Kundenantworten, diesen bestimmten Kunden anschreiben?" Antworten auf diese Frage lassen sich in zwei Kategorien unterteilen: "Ja" oder "Nein". In diesem Fall können Sie die Antwort nutzen, um die Empfänger der Mailing-Kampagne einzugrenzen.

       

    • "Zu welchem Segment gehört dieser Kunde, basierend auf der letzten Kundensegmentierung?" Antworten können in Kategorien fallen wie sogenannte "Empty Nester", "Vorort-Familie" oder "Urban Professionals". Sie könnten anhand dieser Segmente entscheiden, wer das Mailing erhalten sollte.

       

    Für diese Art von Problem mit diskreter Klassifikation bietet Amazon SageMaker zwei Algorithmen: Algorithmus für lineares Lernen und XGBoost-Algorithmus. Sie legen die folgenden Hyperparameter fest, damit diese Algorithmen diskrete Ergebnisse erzeugen:

     

    • Legen Sie für den Algorithmus für Lineares Lernen den predictor_type-Hyperparameter auf binary_classifier fest.

       

    • Für den XGBoost-Algorithmus legen Sie den objective-Hyperparameter auf reg:logistic fest.

     

  • Quantitative Antworten — Betrachten Sie diese Frage: "Was ist, basierend auf dem ROI (Return on Investment) vergangener Mailings, der ROI für ein Mailing an diesen Kunden?" In diesem Fall verwenden Sie den ROI, um Kunden in die Zielgruppe für die Mailing-Kampagne auszuwählen. Für diese quantitativen Analyseprobleme können Sie auch den Algorithmus für lineares Lernen- oder den XGBoost-Algorithmus-Algorithmus verwenden. Sie legen die folgenden Hyperparameter fest, damit diese Algorithmen quantitative Ergebnisse generieren:

     

    • Legen Sie für den Algorithmus für Lineares Lernen den predictor_type-Hyperparameter auf regressor fest.

       

    • Für den XGBoost-Algorithmus legen Sie den objective-Hyperparameter auf reg:linear fest.

     

  • Antworten in Form diskreter Empfehlungen — Betrachten Sie diese Frage: "Welche Inhalte werden basierend auf vergangenen Antworten auf Mailings für die einzelnen Kunden empfohlen?" In diesem Fall sind Sie auf der Suche nach einer Empfehlung dahingehend, was dem Kunden gesendet werden sollte, und nicht ob dem Kunden etwas gesendet werden soll. Für dieses Problems bietet Amazon SageMaker den Factorization Machines-Algorithmus-Algorithmus.

     

Alle Fragen im vorherigen Beispiel vertrauen auf Beispieldaten, die Antworten enthalten. In manchen Fällen benötigen oder bekommen Sie keine Beispieldaten mit Antworten. Dies gilt für Probleme, deren Antworten Gruppen angeben. Beispiel:

  • "Ich möchte aktuelle und potenzielle Kunden in 10 Gruppen basierend auf ihren Attributen gruppieren. Wie sollte ich sie gruppieren?" " Sie könnten sich entscheiden, das Mailing an Kunden in der Gruppe zu senden, die den höchsten Prozentsatz an aktuellen Kunden aufweist, d. h. potenzielle Kunden, die aktuellen Kunden basierend auf denselben Attributen ähnlich sind. Für diese Art von Frage bietet Amazon SageMaker den k-Means-Algorithmus.

     

  • "Was sind die Attribute, die diese Kunden voneinander unterschieden, und was sind die Werte für jeden einzelnen Kunden im Rahmen dieser Dimensionen." Sie verwenden diese Antworten zur Vereinfachung der Übersicht über die aktuellen und potenziellen Kunden und vielleicht auch, um diese Kundenattribute besser zu verstehen. Für diese Art von Frage bietet Amazon SageMaker den Algorithmus für die Hauptkomponentenanalyse (Principal Component Analysis, PCA)-Algorithmus.

Zusätzlich zu diesen Algorithmen für allgemeine Zwecke bietet Amazon SageMaker Algorithmen, die speziell auf bestimmte Anwendungsfälle zugeschnitten sind. Dazu zählen:

  • Bildklassifikationsalgorithmus — Verwenden Sie diesen Algorithmus zur Klassifikation von Bildern. Er verwendet Beispieldaten mit Antworten (bezeichnet als überwachter Algorithmus).

     

  • Sequence-to-Sequence-Algorithmus — Dieser überwachte Algorithmus wird allgemein für neuronale maschinelle Übersetzung verwendet.

     

  • Latent Dirichlet Allocation (LDA)-Algorithmus — Dieser Algorithmus eignet sich für die Bestimmung von Themen in einer Reihe von Dokumenten. Er ist ein unüberwachter Algorithmus, was bedeutet, dass während der Schulung keine Beispieldaten mit Antworten verwendet werden.

     

  • Algorithmus für neuronale Themenmodellierung (NTM) — Eine weitere unüberwachte Methode zur Bestimmung von Themen in einer Reihe von Dokumente mithilfe eines neuronalen Netzwerkansatzes.