Factorization Machines-Algorithmus - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Factorization Machines-Algorithmus

Der Factorization Machines-Algorithmus ist ein allgemeiner überwachter Lernalgorithmus, den Sie sowohl für Klassifizierungs- als auch für Regressionsaufgaben verwenden können. Diese Erweiterung eines linearen Modells ist darauf ausgelegt, Interaktionen zwischen Funktionen innerhalb von hochdimensionalen Datasets mit geringer Dichte wirtschaftlich zu erfassen. In einem Klickvorhersagesystem kann das Factorization Machines-Modell beispielsweise Klickratenmuster erfassen, die beobachtet werden, wenn Anzeigen aus einer bestimmten Anzeigenkategorie auf Seiten einer bestimmten Seitenkategorie geschaltet werden. Factorization Machines sind bei Aufgaben, die hochdimensionale Datasets mit geringer Dichte umfassen (z. B. Klickprognosen und Artikelempfehlungen), eine gute Wahl.

Anmerkung

Der Amazon SageMaker Die Implementierung des Factorization Machines-Algorithmus berücksichtigt nur paarweise (2. Ordnung) Interaktionen zwischen Features.

E/A-Schnittstelle für den Factorization Machines-Algorithmus

Der Factorization Machines-Algorithmus kann entweder im binären Klassifizierungsmodus oder im Regressionsmodus ausgeführt werden. In beiden Modi kann neben dem Dataset für den Schulungskanal auch eines für den Testkanal bereitgestellt werden. Die Bewertung hängt vom verwendeten Modus ab. Im Regressionsmodus wird das Testdataset mithilfe von RMSE (Root Mean Square Error, Wurzel des mittleren quadratischen Prognosefehlers) bewertet. Im binären Klassifizierungsmodus wird das Testdataset anhand von binärer Kreuzentropie (Protokollverlust), Genauigkeit (Grenzwert = 0,5) und F1-Bewertung (Schwellenwert = 0,5) bewertet.

FürAusbildungunterstützt der Factorization Machines-Algorithmus derzeit nur dierecordIO-protobuf..Float32Tensoren. Da als Anwendungsfall in erster Linie Daten mit geringer Dichte in Frage kommen, ist CSV keine gute Wahl. Schulungen sowohl im Datei- als auch im Pipe-Modus werden im vom recordIO umschlossenen protobuf-Format unterstützt.

FürInferenzunterstützt der Factorization Machines-Algorithmusapplication/jsonundx-recordio-protobuf.

  • Für das Problem der binären Klassifizierung sagt der Algorithmus eine Bewertung und eine Bezeichnung voraus. Die Bezeichnung ist eine Zahl und kann entweder 0 oder 1 sein. Die Bewertung ist eine Zahl, die angibt, wie stark der Algorithmus glaubt, dass die Bezeichnung 1 sein sollte. Der Algorithmus berechnet zuerst die Bewertung und leitet aus dem Wert die Bezeichnung ab. Wenn die Punktzahl größer oder gleich 0,5 ist, ist die Bezeichnung 1.

  • Für das Problem der Regression wird nur eine Punktzahl zurückgegeben. Dies ist dann der vorausgesagte Wert. Beispiel: Wenn Factorization Machines verwendet wird, um eine Filmbewertung vorherzusagen, ist die Punktzahl die vorausgesagte Bewertung.

Weitere Informationen zu Schulungs- und Inferenzdateiformaten finden Sie unter Factorization Machines-Beispiel-Notebook.

EC2-Instance-Empfehlung für den Factorization Machines-Algorithmus

Der Amazon SageMaker Der Algorithmus von Factorization Machines ist hoch skalierbar und kann über verteilte Instanzen hinweg Wir empfehlen, für Schulung und Inferenz CPU-Instances bei Datasets mit sowohl geringer als auch hoher Dichte zu verwenden. In einigen Fällen kann sich die Schulung mit einer oder mehreren GPUs bei Daten mit hoher Dichte als vorteilhaft erweisen. Schulungen mit GPUs sind nur für Daten hoher Dichte verfügbar. Verwenden Sie bei Daten mit geringer Dichte CPU-Instances. Der Factorization Machines-Algorithmus unterstützt P2-, P3-, G4dn- und G5-Instanzen für Training und Inferenz.

Factorization Machines-Beispiel-Notebook

Für ein Beispiel-Notizbuch, das die SageMaker Factorization Machines-Algorithmus zur Analyse der Bilder handgeschriebener Ziffern von null bis neun im MNIST-Datensatz, sieheEine Einführung in Faktorisierungsmaschinen mit MNIST. Anweisungen zum Erstellen von und Zugreifen auf Jupyter-Notebook-Instances, die Sie zum Ausführen des Beispiels in SageMaker verwenden können, finden Sie unter Verwenden von Amazon SageMaker Notebook Instances. Nachdem Sie eine Notebook-Instanz erstellt und geöffnet haben, wählen Sie dieSageMaker Beispiele-Registerkarte, um eine Liste aller SageMaker -Proben. Beispiel-Notebooks, die den Factorization Machines-Algorithmus verwenden, befinden sich imEinführung in Amazon-Algorithmen-Abschnitt. Zum Öffnen eines Notebooks klicken Sie auf die Registerkarte Use (Verwenden) und wählen Sie Create copy (Kopie erstellen) aus.