LDA-Hyperparameter - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

LDA-Hyperparameter

In der Anforderung CreateTrainingJob geben Sie den Trainingsalgorithmus an. Sie können auch algorithmusspezifische Hyperparameter als Maps angeben. string-to-string In der folgenden Tabelle sind die Hyperparameter für den von Amazon bereitgestellten LDA-Trainingsalgorhythmus aufgeführt. SageMaker Weitere Informationen finden Sie unter Funktionsweise von LDA.

Name des Parameters Beschreibung
num_topics

Die Anzahl der Themen, die per LDA innerhalb der Daten ermittelt werden sollen.

Erforderlich

Gültige Werte: positive Ganzzahl

feature_dim

Die Vokabulargröße des Eingabedokumentkorpus.

Erforderlich

Gültige Werte: positive Ganzzahl

mini_batch_size

Die Gesamtanzahl der Dokumente im Eingabedokumentkorpus.

Erforderlich

Gültige Werte: positive Ganzzahl

alpha0

Erstschätzung des Konzentrationsparameters: die Summe der Dirichlet-Priorelemente. Geringe Werte führen eher zu kleinen Themenmischungen, bei höheren Werten (über 1.0) werden einheitlichere Mischungen generiert.

Optional

Gültige Werte: Positive Gleitkommazahl

Standardwert: 1.0

max_restarts

Die Anzahl der Neustarts, die während der ALS (Alternating Least Squares)-Spektralzerlegungsphase des Algorithmus ausgeführt werden. Damit lassen sich lokale Minima besserer Qualität ermitteln, jedoch auf Kosten weiterer Berechnungen; und im Allgemeinen sollte hier keine Anpassung erfolgen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 10

max_iterations

Die maximale Anzahl der Iterationen, die im Rahmen der ALS-Phase des Algorithmus ausgeführt werden sollen. Damit lassen sich Minima besserer Qualität ermitteln, jedoch auf Kosten weiterer Berechnungen; und im Allgemeinen sollte hier keine Anpassung erfolgen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 1000

tol

Die Zielfehlertoleranz für die ALS-Phase des Algorithmus. Damit lassen sich Minima besserer Qualität ermitteln, jedoch auf Kosten weiterer Berechnungen; und im Allgemeinen sollte hier keine Anpassung erfolgen.

Optional

Gültige Werte: Positive Gleitkommazahl

Standardwert: 1e-8