Funktionsweise von Factorization Machines

Die Prognosenaufgabe für ein Factorization Machine-Modell besteht darin, eine Funktion ŷ aus einem Funktionsumfang x _i für eine Zieldomain zu schätzen. Diese Domain ist reellwertig für die Regression und binär für die Klassifizierung. Das Factorization Machine-Modell wird überwacht und verfügt somit über ein Trainingsdatensatz (x_i,y_j). Die Vorteile dieses Modells liegen in der Art und Weise, wie es eine faktorisierte Parametrisierung zum Erfassen der paarweisen Funktionsinteraktionen verwendet. Dies kann mathematisch wie folgt dargestellt werden:

Ein Bild, das die Gleichung für das Modell Factorization Machines enthält.

Die drei Ausdrücke in dieser Gleichung entsprechen den drei Komponenten des Modells:

Der w₀ -Ausdruck stellt den globalen Bias-Wert dar.
Die w_i linearen Ausdrücke modellieren die Stärke der i^thVariable.
Die <v_i,v_j> Faktorisierungsbegriffe modellieren die paarweise Interaktion zwischen der i^th und j^th Variablen.

Die globalen Bias- und linearen Ausdrücke gleichen denen in einem linearen Modell. Die paarweisen Funktionsinteraktionen werden im dritten Ausdruck als inneres Produkt der korrespondierenden Faktoren, die für jede Funktion gelernt wurden, modelliert. Diese gelernten Faktoren können auch als einbettende Vektoren der einzelnen Funktion betrachtet werden. Wenn beispielsweise in einer Klassifizierungsaufgabe ein Funktionspaar häufiger gemeinsam in Stichproben mit positiver Bezeichnung vorkommt, ist das innere Produkt von deren Faktoren groß. Mit anderen Worten: Die einbettenden Vektoren liegen in Kosinus-Ähnlichkeit nahe zusammen. Weitere Informationen über das Factorization Machine-Modell finden Sie unter Factorization Machines.

Bei Regressionsaufgaben wird das Modell trainiert, indem der quadratische Fehler zwischen der Modellvorhersage ŷ_n und dem Zielwert y_n minimiert wird. Dies wird als quadratischer Verlust bezeichnet:

Ein Abbild mit der Gleichung für den quadratischen Verlust.

Für eine Klassifizierungsaufgabe wird das Modell trainiert, indem der Kreuz-Entropie-Verlust, auch als Protokollverlust bezeichnet, minimiert wird:

Ein Abbild mit der Gleichung für den Protokollverlust.

Wobei:

Ein Abbild mit der Logistikfunktion der prognostizierten Werte.

Weitere Informationen zu Verlustfunktionen für die Klassifizierung finden Sie unter Loss functions for classification.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Factorization Machines

Hyperparameter