Iperparametri Linear Learner - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Iperparametri Linear Learner

La tabella seguente contiene gli iperparametri per l'algoritmo linear learner. Si tratta di parametri che vengono impostati dagli utenti per agevolare la stima dei parametri del modello dai dati. Gli iperparametri richiesti che devono essere impostati sono elencati prima, in ordine alfabetico. Gli iperparametri facoltativi che possono essere impostati sono elencato dopo, sempre in ordine alfabetico. Quando un iperparametro è impostato suauto, Amazon SageMaker calcolerà e imposterà automaticamente il valore di tale iperparametro.

Nome parametro Descrizione
num_classes

Il numero di classi per la variabile di risposta. L'algoritmo presuppone che classi siano etichettate 0, ..., num_classes - 1.

Obbligatorio quando predictor_type è multiclass_classifier. In caso contrario, l'algoritmo lo ignora.

Valori validi: i numeri interi compresi tra 3 e 1.000.000

predictor_type

Specifica il tipo di variabile di target come classificazione binaria, classificazione multiclasse o regressione.

Campo obbligatorio

Valori validi: binary_classifier, multiclass_classifier o regressor

accuracy_top_k

Quando si calcola il parametro di accuratezza top-k per la classificazione multiclasse, il valore di k. Se il modello assegna uno dei punteggi top-k all'etichetta true, un esempio viene valutato come corretto.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 3

balance_multiclass_weights

Specifica se utilizzare i pesi di classe, che attribuiscono a ciascuna classe uguale importanza nella funzione di perdita. Usato solo quando predictor_type è multiclass_classifier.

Opzionale

Valori validi: true, false

Valore predefinito: false

beta_1

Tasso di decadimento esponenziale per stime di primo momento. Si applica solo quando il valore di optimizer è adam.

Opzionale

Valori validi: auto o un valore in virgola mobile compreso tra 0 e 1,0

Valore predefinito: auto

beta_2

Tasso di decadimento esponenziale per stime di secondo momento. Si applica solo quando il valore di optimizer è adam.

Opzionale

Valori validi: auto o un numero intero in virgola mobile compreso tra 0 e 1,0

Valore predefinito: auto

bias_lr_mult

Consente un tasso di apprendimento diverso per il termine bias. La velocità di apprendimento effettiva per il bias è learning_rate * bias_lr_mult.

Opzionale

Valori validi: auto o un numero intero positivo in virgola mobile

Valore predefinito: auto

bias_wd_mult

Consente una regolarizzazione differente per il termine bias. Il peso di regolarizzazione L2 effettivo per il bias è wd * bias_wd_mult. Per impostazione predefinita non c'è alcuna regolarizzazione sul termine bias.

Opzionale

Valori validi: auto o un numero intero non negativo in virgola mobile

Valore predefinito: auto

binary_classifier_model_selection_criteria

Quando predictor_type è impostato su binary_classifier, i criteri di valutazione del modello per il set di dati di convalida (o per il set di dati di training se non specifichi un set di dati di convalida). I criteri includono:

  • accuracy: modello con la massima precisione.

  • f_beta: modello con il massimo punteggio F1. Il valore predefinito è F1.

  • precision_at_target_recall: modello con la precisione maggiore in un determinato target di richiamo.

  • recall_at_target_precision: modello con il richiamo maggiore in un determinato target di precisione.

  • loss_function: modello con il valore più basso della funzione di perdita utilizzata nell'addestramento.

Opzionale

Valori validi: accuracy, f_beta, precision_at_target_recall, recall_at_target_precision o loss_function

Valore predefinito: accuracy

early_stopping_patience Se non vengono apportati miglioramenti nel parametro rilevante, il numero di epoche (Unix epochs) da aspettare prima di terminare il training. Se hai fornito un valore per binary_classifier_model_selection_criteria, il parametro è questo valore. In caso contrario, il parametro è lo stesso valore specificato per l'iperparametro loss.

Il parametro viene valutato nei dati di convalida. Se non sono stati forniti dati di convalida, il parametro è sempre uguale al valore specificato per l'iperparametro loss e viene valutato sui dati di training. Per disabilitare l'arresto precoce, imposta early_stopping_patience su un valore maggiore del valore specificato per epochs.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 3

early_stopping_tolerance

La tolleranza relativa per misurare un miglioramento nella perdita. Se il rapporto tra il miglioramento nella perdita, diviso per la perdita migliore precedente è inferiore a questo valore, l'arresto precoce considera il miglioramento come zero.

Opzionale

Valori validi: numeri interi positivi in virgola mobile

Valore predefinito: 0,001

epochs

Numero massimo di passate sui dati di training.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 15

f_beta

Il valore della beta da utilizzare quando si calcolano i parametri del punteggio F per la classificazione binaria o multiclasse. Viene utilizzato anche se il valore specificato per binary_classifier_model_selection_criteria è f_beta.

Opzionale

Valori validi: numeri interi positivi in virgola mobile

Valore predefinito: 1.0

feature_dim

Il numero di caratteristiche nei dati di input.

Opzionale

Valori validi: auto o numero intero positivo

Valori predefiniti: auto

huber_delta

Il parametro per la perdita Huber. Durante il training e la valutazione del parametro, calcola la perdita L2 per gli errori di dimensioni inferiori rispetto a delta e la perdita L1 per gli errori di dimensioni superiori a delta.

Opzionale

Valori validi: numeri interi positivi in virgola mobile

Valore predefinito: 1.0

init_bias

Peso iniziale per il termine bias.

Opzionale

Valori validi: numeri interi in virgola mobile

Valore predefinito: 0

init_method

Imposta la funzione di distribuzione iniziale utilizzata per i pesi del modello. Le funzioni includono:

  • uniform: distribuito uniformemente tra (-scale, +scale)

  • normal: distribuzione normale, con media 0 e sigma

Opzionale

Valori validi: uniform o normal

Valore predefinito: uniform

init_scale

Ridimensiona una distribuzione uniforme iniziale per i pesi del modello. Si applica solo quando l'iperparametro init_method è impostato su uniform.

Opzionale

Valori validi: numeri interi positivi in virgola mobile

Valore predefinito: 0,07

init_sigma

La deviazione standard iniziale per la distribuzione normale. Si applica solo quando l'iperparametro init_method è impostato su normal.

Opzionale

Valori validi: numeri interi positivi in virgola mobile

Valore predefinito: 0,01

l1

Il parametro di regolarizzazione L1. Se non vuoi usare la regolarizzazione L1, imposta il valore su 0.

Opzionale

Valori validi: auto o float non negativo

Valore predefinito: auto

learning_rate

L'incremento utilizzato dall'ottimizzatore per gli aggiornamenti dei parametri.

Opzionale

Valori validi: auto o un numero intero positivo in virgola mobile

Valore predefinito: auto, il cui valore dipende dall'ottimizzatore scelto.

loss

Specifica la funzione di perdita.

Le funzioni di perdita disponibili e i relativi valori predefiniti dipendono dal valore di predictor_type:

  • Se predictor_type è impostato su regressor, le opzioni disponibili sono auto, squared_loss, absolute_loss, eps_insensitive_squared_loss, eps_insensitive_absolute_loss, quantile_loss e huber_loss. Il valore predefinito per auto è squared_loss.

  • Se predictor_type è impostato su binary_classifier, le opzioni disponibili sono auto, logistic e hinge_loss. Il valore predefinito per auto è logistic.

  • Se predictor_type è impostato su multiclass_classifier, le opzioni disponibili sono auto e softmax_loss. Il valore predefinito per auto è softmax_loss.

Valori validi: auto, logistic, squared_loss, absolute_loss, hinge_loss, eps_insensitive_squared_loss, eps_insensitive_absolute_loss, quantile_loss o huber_loss

Opzionale

Valore predefinito: auto

loss_insensitivity

Il parametro per tipo di perdita epsilon-insensitive. Durante il training e la valutazione del parametro, qualsiasi errore di dimensioni inferiori a questo valore è considerato come zero.

Opzionale

Valori validi: numeri interi positivi in virgola mobile

Valore predefinito: 0,01

lr_scheduler_factor

Per ogni iperparametro lr_scheduler_step, la velocità di apprendimento diminuisce di questa quantità. Si applica solo quando l'iperparametro use_lr_scheduler è impostato su true.

Opzionale

Valori validi: auto o un numero intero positivo in virgola mobile compreso tra 0 e 1

Valore predefinito: auto

lr_scheduler_minimum_lr

La velocità di apprendimento non viene mai diminuita su un valore inferiore al valore impostato per lr_scheduler_minimum_lr. Si applica solo quando l'iperparametro use_lr_scheduler è impostato su true.

Opzionale

Valori validi: auto o un numero intero positivo in virgola mobile

Valori predefiniti: auto

lr_scheduler_step

Il numero di fasi tra diminuzioni del tasso di apprendimento. Si applica solo quando l'iperparametro use_lr_scheduler è impostato su true.

Opzionale

Valori validi: auto o numero intero positivo

Valore predefinito: auto

margin

Il margine per la funzione hinge_loss.

Opzionale

Valori validi: numeri interi positivi in virgola mobile

Valore predefinito: 1.0

mini_batch_size

Il numero di osservazioni per ogni mini batch per l'iterazione di dati.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 1000

momentum

Il momento dell'ottimizzatore sgd.

Opzionale

Valori validi: auto o un numero intero in virgola mobile compreso tra 0 e 1,0

Valore predefinito: auto

normalize_data

Normalizza i dati delle caratteristiche prima del training. La normalizzazione dei dati sposta i dati per ogni caratteristica in modo da avere una media di zero e la dimensiona per avere una deviazione standard dell'unità.

Opzionale

Valori validi: auto, true o false

Valore predefinito: true

normalize_label

Normalizza l'etichetta. La normalizzazione sposta l'etichetta in modo da avere una media pari a zero e la ridimensiona per avere la deviazione di unità standard.

Il valore predefinito auto normalizza l'etichetta per i problemi di regressione, ma non per i problemi di classificazione. Se imposti l'iperparametro normalize_label su true per i problemi di classificazione, l'algoritmo lo ignora.

Opzionale

Valori validi: auto, true o false

Valore predefinito: auto

num_calibration_samples

Il numero di osservazioni del set di dati di convalida da usare per la calibrazione del modello (per trovare la soglia migliore).

Opzionale

Valori validi: auto o numero intero positivo

Valore predefinito: auto

num_models

Il numero di modelli da sottoporre al training in parallelo. Per impostazione predefinita auto, l'algoritmo decide il numero di modelli da preparare. Un modello viene preparato in base al parametro di training specificato (regolarizzazione, ottimizzatore, perdita) e gli altri in base a parametri chiusi.

Opzionale

Valori validi: auto o numero intero positivo

Valori predefiniti: auto

num_point_for_scaler

Il numero di punti di dati da utilizzare per calcolare la normalizzazione o l'eliminazione del bias dei termini.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 10,000

optimizer

L'algoritmo di ottimizzazione da usare.

Opzionale

Valori validi:

  • auto: valore predefinito.

  • sgd: discesa stocastica del gradiente.

  • adam: stima del momento adattivo.

  • rmsprop: tecnica di ottimizzazione basata sui gradienti che utilizza una media mobile di gradienti quadrati per normalizzare il gradiente.

Valore predefinito: auto. L'impostazione predefinita per auto è adam.

positive_example_weight_mult

Il peso assegnato a esempi positivi durante il training di un classificatore binario. Il peso di esempi negativi è fissato a 1. Se l'algoritmo dovrà scegliere un peso in modo che gli errori di classificazione degli esempi negativi rispetto ai positivi abbiano lo stesso impatto nella perdita di training, specifica balanced. Se vuoi che l'algoritmo scelga il peso che ottimizza le prestazioni, specifica auto.

Opzionale

Valori validi: balanced, auto o un numero intero positivo in virgola mobile

Valore predefinito: 1.0

quantile

Il quantile per la perdita quantile. Per quantile q, il modello cerca di generare le previsioni in modo tale che il valore di true_label sia superiore alla previsione con probabilità q.

Opzionale

Valori validi: un numero intero in virgola mobile compreso tra 0 e 1

Valore predefinito: 0.5

target_precision

La precisione di target. Se binary_classifier_model_selection_criteria è recall_at_target_precision, la precisione viene mantenuta a questo valore durante la massimizzazione della richiamata.

Opzionale

Valori validi: un numero intero in virgola mobile compreso tra 0 e 1.0

Valore predefinito: 0,8

target_recall

La richiamata di target. Se binary_classifier_model_selection_criteria è precision_at_target_recall, la richiamata viene mantenuta a questo valore durante la massimizzazione della precisione.

Opzionale

Valori validi: un numero intero in virgola mobile compreso tra 0 e 1.0

Valore predefinito: 0,8

unbias_data

Toglie il bias dalle caratteristiche prima del training in modo che la media sia pari a 0. Per impostazione predefinita i dati non sono bias in quanto l'iperparametro use_bias è impostato su true.

Opzionale

Valori validi: auto, true o false

Valore predefinito: auto

unbias_label

Toglie il bias dalle etichette prima del training in modo che la media sia pari a 0. Si applica solo alla regressione se l'iperparametro use_bias è impostato su true.

Opzionale

Valori validi: auto, true o false

Valore predefinito: auto

use_bias

Specifica se il modello deve includere un termine bias, che è il termine di intercettazione nell'equazione lineare.

Opzionale

Valori validi: true o false

Valore predefinito: true

use_lr_scheduler

Indica se usare un pianificatore per la velocità di apprendimento. Se vuoi utilizzare un pianificatore, specifica true.

Opzionale

Valori validi: true o false

Valore predefinito: true

wd

Il parametro di decadimento del peso, noto anche come parametro di regolarizzazione L2. Se non vuoi usare la regolarizzazione L2, imposta il valore su 0.

Opzionale

Valori validi: auto o un numero intero non negativo in virgola mobile

Valore predefinito: auto