Hyperparameter für den linearen Lerner - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Hyperparameter für den linearen Lerner

Die folgende Tabelle enthält die Hyperparameter für den Algorithmus für das lineare Lernen. Dies sind Parameter, die von Benutzern festgelegt werden, um die Schätzung der Modellparameter aus Daten zu erleichtern. Die obligatorischen Hyperparameter, die festgelegt werden müssen, sind zuerst aufgelistet (in alphabetischer Reihenfolge). Die optionalen Hyperparameter, die festgelegt werden können, sind als Nächstes aufgeführt (ebenfalls in alphabetischer Reihenfolge). Wenn ein Hyperparameter auf auto gesetzt wird, berechnet und setzt Amazon SageMaker automatisch den Wert dieses Hyperparameters.

Parametername Beschreibung
num_classes

Die Anzahl der Klassen für die Antwortvariable. Der Algorithmus geht davon aus, dass Klassen mit 0, ..., num_classes - 1 bezeichnet werden.

Erforderlich, wenn predictor_type mit multiclass_classifier angegeben ist. Andernfalls wird dies vom Algorithmus ignoriert.

Gültige Werte: Ganzzahlen zwischen 3 und 1 000 000

predictor_type

Gibt den Typ der Zielvariable als binäre Klassifizierung, Mehrklassen-Klassifizierung oder Regression an.

Erforderlich

Gültige Werte: binary_classifier, multiclass_classifier oder regressor

accuracy_top_k

Bei der Berechnung der Top-K-Genauigkeitsmetrik für die Mehrklassen-Klassifizierung der Wert von k. Wenn das Modell der tatsächlichen Bezeichnung eines der Top-K-Punktzahlen zuweist, wird ein Beispiel als korrekt bewertet.

Optional

Gültige Werte: positive Ganzzahlen

Standardwert: 3

balance_multiclass_weights

Gibt an, ob die Klassengewichtungen verwendet werden sollen, wodurch jede Klasse in der Verlustfunktion gleiches Gewicht erhält. Wird nur verwendet, wenn predictor_type multiclass_classifier ist.

Optional

Zulässige Werte: true, false

Standardwert: false

beta_1

Die exponentielle Zerfallsrate für Schätzwerte im ersten Schritt. Nur anwendbar, wenn der Wert von optimizer gleich adam ist.

Optional

Gültige Werte: auto oder Gleitkommawert zwischen 0 und 1,0

Standardwert: auto

beta_2

Die exponentielle Zerfallsrate für Schätzwerte im zweiten Schritt. Nur anwendbar, wenn der Wert von optimizer gleich adam ist.

Optional

Gültige Werte: auto oder Gleitkomma-Ganzzahl zwischen 0 und 1,0

Standardwert: auto

bias_lr_mult

Ermöglicht eine andere Lernrate für die Verzerrungsbedingung. Die tatsächliche Lernrate für die Verzerrung ist learning_rate * bias_lr_mult.

Optional

Gültige Werte: auto oder positive Gleitkomma-Ganzzahl

Standardwert: auto

bias_wd_mult

Ermöglicht andere Regularisierung für die Verzerrungsbedingung. Die tatsächliche L2-Regularisierungsgewichtung für die Verzerrung ist wd * bias_wd_mult. Standardmäßig gibt es keine Regularisierung der Verzerrungsbedingung.

Optional

Gültige Werte: auto oder nicht negative Gleitkomma-Ganzzahl

Standardwert: auto

binary_classifier_model_selection_criteria

Wenn predictor_type auf binary_classifier festgelegt ist, die Modellbewertungskriterien für das Validierungsdataset (oder für das Schulungsdataset, wenn Sie kein Validierungdataset angeben). Kriterien sind:

  • accuracy—Das Modell mit der höchsten Genauigkeit.

  • f_beta—Das Modell mit dem höchsten F1-Ergebnis. Der Standardwert ist F1.

  • precision_at_target_recall—Das Modell mit der höchsten Präzision bei einem gegebenen Recall-Ziel.

  • recall_at_target_precision—Das Modell mit dem höchsten Recall bei einem bestimmten Präzisionsziel.

  • loss_function—Das Modell mit dem niedrigsten Wert der im Training verwendeten Verlustfunktion.

Optional

Gültige Werte: accuracy, f_beta, precision_at_target_recall, recall_at_target_precision oder loss_function

Standardwert: accuracy

early_stopping_patience Die Anzahl der abzuwartenden Epochen, bevor die Schulung endet, wenn keine Verbesserung in der entsprechenden Metrik erzielt wird. Wenn Sie einen Wert für binary_classifier_model_selection_criteria angegeben haben, entspricht die Metrik diesem Wert. Andernfalls entspricht die Metrik dem für den loss-Hyperparameter angegebenen Wert.

Die Metrik wird für die Validierungsdaten ausgewertet. Wenn Sie keine Validierungsdaten angegeben haben, entspricht die Metrik immer dem für den loss-Hyperparameter angegebenen Wert und wird anhand der Schulungsdaten ausgewertet. Zum Deaktivieren des frühzeitigen Beendens legen Sie early_stopping_patience auf einen Wert fest, der größer als der für epochs angegebene Wert ist.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 3

early_stopping_tolerance

Die relative Toleranz zur Messung von Verlustverbesserungen. Wenn das Verhältnis der Verlustverbesserung dividiert durch den vorherigen besten Verlust kleiner als dieser Wert ist, betrachtet der Prozess zum frühzeitigen Beenden die Verbesserung als null.

Optional

Gültige Werte: positive Gleitkomma-Ganzzahl

Standardwert: 0.001

epochs

Die maximale Anzahl von Durchläufen der Schulungsdaten.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 15

f_beta

Der Wert von Beta zur Berechnung von F-Bewertungsmetriken für binäre oder Mehrklassen-Klassifizierung. Dieser wird auch verwendet, wenn der für binary_classifier_model_selection_criteria angegebene Wert f_beta lautet.

Optional

Gültige Werte: positive Gleitkomma-Ganzzahlen

Standardwert: 1.0

feature_dim

Die Anzahl der Merkmale der Eingabedaten.

Optional

Gültige Werte: auto oder positive Ganzzahl

Standardwerte: auto

huber_delta

Der Parameter für Huber-Verlust. Während der Schulungs- und der Metrikevaluation wird mit einem L2-Verlust für Fehler gerechnet, die kleiner sind als Delta und einem L1-Verlust für Fehler, die größer als Delta sind.

Optional

Gültige Werte: positive Gleitkomma-Ganzzahl

Standardwert: 1.0

init_bias

Initiale Gewichtung für die Verzerrungsbedingung.

Optional

Gültige Werte: Gleitkomma-Ganzzahl

Standardwert: 0

init_method

Legt die anfängliche Verteilungsfunktion für Modellgewichtungen fest. Zu den Funktionen gehören:

  • uniform—Gleichmäßig verteilt zwischen (-Skala, +Skala)

  • normal—Normalverteilung mit Mittelwert 0 und Sigma

Optional

Gültige Werte: uniform oder normal.

Standardwert: uniform

init_scale

Skaliert eine erste einheitliche Verteilung für Modellgewichtungen. Gilt nur, wenn der init_method-Hyperparameter auf uniform festgelegt ist.

Optional

Gültige Werte: positive Gleitkomma-Ganzzahl

Standardwert: 0.07

init_sigma

Die anfängliche Standardabweichung für die Normalverteilung. Gilt nur, wenn der init_method-Hyperparameter auf normal festgelegt ist.

Optional

Gültige Werte: positive Gleitkomma-Ganzzahl

Standardwert: 0.01

l1

Der L1-Regularisierungsparameter. Wenn Sie die L1-Regularisation nicht verwenden möchten, legen Sie diesen Wert auf 0 fest.

Optional

Gültige Werte: auto oder nicht negative Gleitkommazahl

Standardwert: auto

learning_rate

Die Schrittgröße, die der Optimierer für Parameteraktualisierungen verwendet.

Optional

Gültige Werte: auto oder positive Gleitkomma-Ganzzahl

Standardwert: auto, dessen Wert vom ausgewählten Optimierer abhängt.

loss

Gibt die Verlustfunktion an.

Die verfügbaren Verlustfunktionen und deren Standardwerte hängen von dem Wert von predictor_type ab:

  • Wenn predictor_type auf regressor festgelegt ist, sind die Optionen auto, squared_loss, absolute_loss, eps_insensitive_squared_loss, eps_insensitive_absolute_loss, quantile_loss und huber_loss verfügbar. Der Standardwert für den auto beträgt squared_loss.

  • Wenn predictor_type auf binary_classifier festgelegt ist, sind die Optionen auto, logistic und hinge_loss verfügbar. Der Standardwert für den auto beträgt logistic.

  • Wenn predictor_type auf multiclass_classifier festgelegt ist, sind die Optionen auto und softmax_loss verfügbar. Der Standardwert für den auto beträgt softmax_loss.

Gültige Werte: auto, logistic, squared_loss, absolute_loss, hinge_loss, eps_insensitive_squared_loss, eps_insensitive_absolute_loss, quantile_loss oder huber_loss

Optional

Standardwert: auto

loss_insensitivity

Der Parameter für den Epsilon-unempfindlichen Verlusttyp. Während der Schulungs- und der Metrikevaluation werden Fehler, die kleiner als dieser Wert sind, als null betrachtet.

Optional

Gültige Werte: positive Gleitkomma-Ganzzahl

Standardwert: 0.01

lr_scheduler_factor

Bei jedem lr_scheduler_step-Hyperparameter verringert sich die Lernrate um diese Menge. Gilt nur, wenn der use_lr_scheduler-Hyperparameter auf true festgelegt ist.

Optional

Gültige Werte: auto oder positive Gleitkomma-Ganzzahl zwischen 0 und 1

Standardwert: auto

lr_scheduler_minimum_lr

Die Lernrate sinkt niemals auf einen Wert kleiner als der für lr_scheduler_minimum_lr festgelegte Wert. Gilt nur, wenn der use_lr_scheduler-Hyperparameter auf true festgelegt ist.

Optional

Gültige Werte: auto oder positive Gleitkomma-Ganzzahl

Standardwerte: auto

lr_scheduler_step

Die Anzahl der Schritte zwischen der Verringerung der Lernrate. Gilt nur, wenn der use_lr_scheduler-Hyperparameter auf true festgelegt ist.

Optional

Gültige Werte: auto oder positive Ganzzahl

Standardwert: auto

margin

Der Rand für die hinge_loss-Funktion

Optional

Gültige Werte: positive Gleitkomma-Ganzzahl

Standardwert: 1.0

mini_batch_size

Die Anzahl der Beobachtungen pro Mini-Stapel für den Dateniterator.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 1000

momentum

Die Dynamik des sgd-Optimierers.

Optional

Gültige Werte: auto oder eine Gleitkomma-Ganzzahl zwischen 0 und 1,0

Standardwert: auto

normalize_data

Normalisiert die Merkmalsdaten vor der Schulung. Die Datennormalisierung verschiebt die Daten für jedes Merkmal auf einen Mittelwert von 0 und skaliert so, dass sich eine einheitliche Standardabweichung ergibt.

Optional

Gültige Werte: auto, true oder false

Standardwert: true

normalize_label

Normalisiert die Kennzeichnung. Durch die Normalisierung wird die Bezeichnung auf einen Mittelwert von 0 verschoben und skaliert, um eine einheitliche Standardabweichung zu erreichen.

Der Standardwert auto normalisiert die Bezeichnung für Regressionsprobleme, nicht aber für Klassifizierungsprobleme. Wenn Sie den normalize_label-Hyperparameter bei Klassifizierungsproblemen auf true festlegen, wird er vom Algorithmus ignoriert.

Optional

Gültige Werte: auto, true oder false

Standardwert: auto

num_calibration_samples

Die Anzahl der aus dem Validierungsdataset für die Modellkalibrierung zu verwendenden Beobachtungen (beim Suchen des besten Schwellenwerts).

Optional

Gültige Werte: auto oder positive Ganzzahl

Standardwert: auto

num_models

Die Anzahl der parallel zu schulenden Modelle. Beim Standardwert auto entscheidet der Algorithmus über die Anzahl der parallel zu schulenden Modelle. Ein Modell wird entsprechend den vorgegebenen Schulungsparametern geschult (Regularisierung, Optimierer, Verlust) und die übrigen durch ähnliche Parameter.

Optional

Gültige Werte: auto oder positive Ganzzahl

Standardwerte: auto

num_point_for_scaler

Die Anzahl der Datenpunkte, die zur Berechnung der Normalisierung oder Entzerrung der Bedingungen verwendet werden.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 10,000

optimizer

Der Optimierungsalgorithmus, der verwendet werden soll.

Optional

Zulässige Werte:

  • auto—Der Standardwert

  • sgd—Stochastischer Gradientenabstieg.

  • adamAdaptive Momentschätzung.

  • rmsprop—Eine gradientenbasierte Optimierungstechnik, die einen gleitenden Durchschnitt quadratischer Gradienten verwendet, um den Gradienten zu normalisieren.

Standardwer: auto. Die Standardeinstellung für auto lautet adam.

positive_example_weight_mult

Die Gewichtung, die positiven Beispielen bei der Schulung mit binärer Klassifizierung zugewiesen wird. Das Gewichtung von negativen Beispielen ist auf 1 festgelegt. Wenn der Algorithmus eine Gewichtung auswählen soll, mit der Fehler bei der Klassifizierung positiver und negativer Beispiele den gleichen Einfluss auf den Schulungsverlust haben, geben Sie balanced an. Wenn Sie möchten, dass der Algorithmus die Gewichtung auswählt, mit der die Leistung optimiert wird, geben Sie auto an.

Optional

Gültige Werte: balanced, autooder eine positive Gleitkomma-Ganzzahl

Standardwert: 1.0

quantile

Das Quantil für Quantilverlust. Das Modell versucht für das Quantil q Prognosen zu erstellen, sodass der Wert von true_label größer ist als die Prognose mit der Wahrscheinlichkeit q.

Optional

Gültige Werte: Gleitkomma-Ganzzahl zwischen 0 und 1

Standardwert: 0.5

target_precision

Die Zielpräzision. Wenn binary_classifier_model_selection_criteria den Wert recall_at_target_precision hat, wird die Präzision auf diesem Wert gehalten, während der Recall maximiert wird.

Optional

Gültige Werte: Gleitkomma-Ganzzahl zwischen 0 und 1.0

Standardwert: 0.8

target_recall

Der Ziel-Recall. Wenn binary_classifier_model_selection_criteria den Wert precision_at_target_recall hat, wird der Recall auf diesem Wert gehalten, während die Präzision maximiert wird.

Optional

Gültige Werte: Gleitkomma-Ganzzahl zwischen 0 und 1.0

Standardwert: 0.8

unbias_data

Entfernt Verzerrungen der Merkmale vor der Schulung, sodass der Mittelwert 0 ist. Standardmäßig sind die Daten unverzerrt, wenn der use_bias-Hyperparameter auf true gesetzt wurde.

Optional

Gültige Werte: auto, true oder false

Standardwert: auto

unbias_label

Entfernt Verzerrungen der Kennzeichnungen vor der Schulung, sodass der Mittelwert 0 ist. Gilt nur bei Regression, wenn der use_bias-Hyperparameter auf true festgelegt ist.

Optional

Gültige Werte: auto, true oder false

Standardwert: auto

use_bias

Gibt an, ob das Modell eine Verzerrungsbedingung enthalten soll. Dabei handelt es sich um die Intercept-Bedingung in der linearen Gleichung.

Optional

Gültige Werte: true oder false.

Standardwert: true

use_lr_scheduler

Gibt an, ob ein Scheduler für die Lernrate verwendet werden soll. Wenn Sie einen Scheduler verwenden möchten, geben Sie true an.

Optional

Gültige Werte: true oder false.

Standardwert: true

wd

Der Weight-Decay-Parameter, auch bekannt als L2-Regularisationsparameter. Wenn Sie die L2-Regularisation nicht verwenden möchten, legen Sie diesen Wert auf 0 fest.

Optional

Gültige Werte: auto oder nicht negative Gleitkomma-Ganzzahl

Standardwert: auto