Machine Learning für Anfänger und Experten - Amazon Redshift

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Machine Learning für Anfänger und Experten

Amazon Redshift ML ermöglicht es Ihnen, Modelle mit einem einzigen SQL-CREATE-MODEL-Befehl zu trainieren. Der Befehl CREATE MODEL erstellt ein Modell, das Amazon Redshift verwendet, um modellbasierte Prognosen mit vertrauten SQL-Konstrukten zu generieren.

Amazon Redshift ML besonders nützlich, wenn Sie über keine Fachkenntnisse in Bereichen Machine Learning, Tools, Sprachen, Algorithmus und APIs verfügen. Mit Amazon Redshift ML sparen Sie sich den Aufwand, der mit der Integration eines externen Machine-Learning-Services verbunden ist. Amazon Redshift spart Ihnen Zeit, um Daten zu formatieren und zu verschieben, Berechtigungskontrollen zu verwalten und benutzerdefinierte Integrationen, Workflows und Skripts zu entwickeln. Sie können ganz einfach gängige Machine-Learning-Algorithmen verwenden und Trainingsanforderungen vereinfachen, die häufige Iterationen vom Training bis zur Prognose erfordern. Amazon Redshift erkennt automatisch den besten Algorithmus und passt das beste Modell für Ihr Problem an. Sie können Prognosen innerhalb des Amazon-Redshift-Clusters erstellen, ohne dass Daten aus Amazon Redshift verschoben werden müssen. Da Sie sich nicht mit einem anderen Service verbinden müssen, sparen Sie außerdem die damit verbundenen Kosten.

Amazon Redshift ML unterstützt Datenanalysten und Datenwissenschaftler bei der Nutzung von Machine Learning. Damit können Experten für Machine Learning auch ihr Wissen dazu nutzen, mit der Anweisung CREATE MODEL nur die von ihnen angegebenen Aspekte zu verwenden. Dadurch können Sie die Zeit verkürzen, die CREATE MODEL benötigt, um den besten Kandidaten zu finden, die Genauigkeit des Modells zu verbessern oder beides zu erreichen.

Die Anweisung CREATE MODEL bietet Ihnen Flexibilität beim Festlegen der Parameter für den Trainingsauftrag. Dank dieser Flexibilität können sowohl Anfänger als auch Experten im Bereich Machine Learning ihre bevorzugten Präprozessoren, Algorithmen, Problemtypen und Hyperparameter auswählen. So kann zum Beispiel ein Benutzer, der mehr über die Kundenabwanderung erfahren möchte, für die CREATE-MODEL-ANWEISUNG festlegen, dass der Problemtyp eine binäre Klassifizierung sein soll, die für den Bereich Kundenabwanderung geeignet ist. Die CREATE-MODEL-Anweisung schränkt die Suche nach dem besten Modell dann auf Modelle mit binärer Klassifizierung ein. Selbst wenn der Benutzer den Problemtyp frei auswählen kann, bleiben immer noch viele Optionen übrig, mit denen die CREATE-MODEL-Anweisung arbeiten kann. Beispielsweise kann CREATE MODEL die besten Vorverarbeitungstransformationen finden und anwenden sowie die besten Hyperparametereinstellungen ermitteln.

Amazon Redshift ML erleichtert das Training, indem es automatisch das beste Modell mit Amazon SageMaker Autopilot findet. Amazon SageMaker Autopilot trainiert und optimiert im Hintergrund automatisch das beste Machine-Learning-Modell basierend auf Ihren bereitgestellten Daten. Amazon SageMaker Neo kompiliert dann das Trainingsmodell und stellt es für Prognosen in Ihrem Redshift-Cluster zur Verfügung. Wenn Sie eine Machine-Learning-Inferenzabfrage mit einem trainierten Modell ausführen, kann die Abfrage die MPP-Funktionen (Massively Parallel Processing) von Amazon Redshift nutzen. Gleichzeitig kann die Abfrage auf Machine Learning basierende Vorhersage verwenden.

  • Als Anfänger im Bereich Machine Learning mit allgemeinen Kenntnissen zu unterschiedlichen ML-Aspekten wie Präprozessoren, Algorithmen und Hyperparametern können Sie die CREATE-MODEL-Anweisung für die von Ihnen angegebenen Aspekte verwenden. Sie können dann die Zeit verkürzen, die CREATE MODEL benötigt, um den besten Kandidaten zu finden oder die Genauigkeit des Modells zu verbessern. Außerdem können Sie den geschäftlichen Wert der Prognosen erhöhen, indem Sie zusätzliche Domäneninformationen wie den Problemtyp oder das Ziel hinzufügen. Wenn beispielsweise in einem Kundenabwanderungsszenario das Ergebnis „Kunde ist nicht aktiv“ selten ist, wird das F1-Ziel häufig dem Ziel „Genauigkeit“ vorgezogen. Modelle mit einer hohen Genauigkeit sagen wahrscheinlich immer „Kunde ist aktiv“ voraus. Dies ergibt zwar eine hohe Genauigkeit, jedoch ist der geschäftliche Wert gering. Weitere Informationen zu F1-Zielen finden Sie unter AutoMLJobObjective in der Amazon SageMaker -API-Referenz .

    Weitere Informationen zu den grundlegenden Optionen für die CREATE-MODEL-Anweisung finden Sie unter Einfaches CREATE MODEL.

  • Als Fortgeschrittener im Bereich Machine Learning können Sie den Problemtyp und die Präprozessoren für manche (nicht alle) Merkmale angeben. Dann folgt CREATE MODEL Ihren Vorschlägen zu den angegebenen Aspekten. Gleichzeitig ermittelt CREATE MODEL noch die besten Präprozessoren für die verbleibenden Funktionen und die besten Hyperparameter. Weitere Informationen zum Einschränken von einem oder mehreren Aspekten der Trainings-Pipeline finden Sie unter CREATE MODEL mit Benutzerführung.

  • Als Experte im Bereich Machine Learning haben Sie die volle Kontrolle über das Training und die Optimierung der Hyperparameter. CREATE MODEL versucht dann nicht, die besten Präprozessoren, Algorithmen und Hyperparameter zu ermitteln, da Sie alle Entscheidungen treffen. Weitere Informationen zur Verwendung von CREATE MODEL mit AUTO OFF finden Sie unter CREATE XGBoost-Modelle mit AUTO OFF.

  • Als Dateningenieur können Sie ein vortrainiertes XGBoost-Modell in Amazon verwenden SageMaker und es zur lokalen Inferenz in Amazon Redshift importieren. Mit Bring Your Own Model (BYOM) können Sie ein Modell verwenden, das außerhalb von Amazon Redshift mit Amazon SageMaker für die lokale Inferenz in Amazon Redshift trainiert wurde. Amazon Redshift ML unterstützt die Verwendung von BYOM in der lokalen oder Remote-Inferenz.

    Weitere Informationen zur Verwendung der CREATE-MODEL-Anweisung für die lokale oder Remote-Inferenz finden Sie unter Bring Your Own Model (BYOM) - lokale Inferenz.

Als Benutzer von Amazon Redshift ML können Sie eine der folgenden Optionen auswählen, um Ihr Modell zu trainieren und bereitzustellen: