Ottimizzazione di un modello di apprendimento lineare - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Ottimizzazione di un modello di apprendimento lineare

L'ottimizzazione automatica dei modelli, nota anche come ottimizzazione degli iperparametri, trova la versione migliore di un modello eseguendo molti processi che testano un intervallo di iperparametri sul set di dati. Scegli gli iperparametri ottimizzabili, un intervallo di valori per ciascuno di essi e un parametro obiettivo. Puoi scegliere il parametro obiettivo tra i parametri calcolati dall'algoritmo. L'ottimizzazione automatica del modello ricerca gli iperparametri scelti per trovare la combinazione di valori che restituisce il modello che ottimizza il parametro obiettivo.

L'algoritmo Linear Learner ha inoltre un meccanismo interno per l'ottimizzazione degli iperparametri separato dalla caratteristica di ottimizzazione automatica del modello descritta qui. Per impostazione predefinita, l'algoritmo Linear Learner ottimizza gli iperparametri addestrando più modelli in parallelo. Quando usi l'ottimizzazione automatica dei modelli, il meccanismo di ottimizzazione interni dell'algoritmo Linear Learner viene disattivato automaticamente. In tal modo il numero di modelli paralleli, num_models, viene impostato su 1. L'algoritmo ignora qualsiasi valore impostato per num_models.

Per ulteriori informazioni sull'ottimizzazione del modello, consulta Esegui l'ottimizzazione automatica del modello con SageMaker.

Parametri calcolati dall'algoritmo di apprendimento lineare

L'algoritmo Linear Learner restituisce i parametri nella tabella seguente, che vengono calcolati durante il training. Scegline uno come parametro obiettivo. Per evitare l'overfitting, ti consigliamo di ottimizzare il modello con un parametro di convalida anziché un parametro di training.

Nome parametro Descrizione Direzione dell'ottimizzazione
test:absolute_loss

La perdita del modello finale nel set di dati di test. Questo parametro oggettivo è valido solo per la regressione.

Minimizza

test:binary_classification_accuracy

L'accuratezza del modello finale nel set di dati di test. Questo parametro oggettivo è valido solo per la classificazione binaria.

Massimizza

test:binary_f_beta

Il punteggio F-beta del modello finale nel set di dati di test. Per impostazione predefinita, è il punteggio F1, che è la media armonica di precisione e richiamata. Questo parametro oggettivo è valido solo per la classificazione binaria.

Massimizza

test:dcg

Il guadagno cumulativo scontato del modello finale nel set di dati di test. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

test:macro_f_beta

Il punteggio F-beta del modello finale nel set di dati di test. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

test:macro_precision

Il punteggio di precisione del modello finale nel set di dati di test. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

test:macro_recall

Il punteggio di richiamata del modello finale nel set di dati di test. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

test:mse

L'errore quadratico medio del modello finale nel set di dati di test. Questo parametro oggettivo è valido solo per la regressione.

Minimizza

test:multiclass_accuracy

L'accuratezza del modello finale nel set di dati di test. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

test:multiclass_top_k_accuracy

La accuratezza tra le prime etichette k previste sul set di dati del test. Se scegli questo parametro come obiettivo, consigliamo di impostare il valore di k utilizzando l'iperparametro accuracy_top_k. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

test:objective_loss

Il valore medio della funzione di perdita obiettivo sul set di dati di test dopo che il modello è stato sottoposto al training. Per impostazione predefinita, la perdita è la perdita logistica per la classificazione binaria e la perdita al quadrato per la regressione. Per impostare la perdita di altri tipi, utilizza l'iperparametro loss.

Minimizza

test:precision

La precisione del modello finale nel set di dati di test. Se scegli questo parametro come obiettivo, ti consigliamo di impostare una richiamata di target impostando l'iperparametro binary_classifier_model_selection su precision_at_target_recall e il valore per l'iperparametro target_recall. Questo parametro oggettivo è valido solo per la classificazione binaria.

Massimizza

test:recall

La richiamata del modello finale nel set di dati di test. Se scegli questo parametro come obiettivo, ti consigliamo di impostare una precisione di target impostando l'iperparametro binary_classifier_model_selection su recall_at_target_precision e il valore per l'iperparametro target_precision. Questo parametro oggettivo è valido solo per la classificazione binaria.

Massimizza

test:roc_auc_score

L'area sotto la curva caratteristica operativa del ricevitore (curva ROC) del modello finale nel set di dati di test. Questo parametro oggettivo è valido solo per la classificazione binaria.

Massimizza

validation:absolute_loss

La perdita assoluta del modello finale nel set di dati di convalida. Questo parametro oggettivo è valido solo per la regressione.

Minimizza

validation:binary_classification_accuracy

L'accuratezza del modello finale nel set di dati di convalida. Questo parametro oggettivo è valido solo per la classificazione binaria.

Massimizza

validation:binary_f_beta

Il punteggio F-beta del modello finale nel set di dati di convalida. Per impostazione predefinita, il punteggio F-beta è il punteggio F1, che è la media armonica dei parametri validation:precision e validation:recall. Questo parametro oggettivo è valido solo per la classificazione binaria.

Massimizza

validation:dcg

Il guadagno cumulativo scontato del modello finale nel set di dati di convalida. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

validation:macro_f_beta

Il punteggio F-beta del modello finale nel set di dati di convalida. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

validation:macro_precision

Il punteggio della precisione del modello finale nel set di dati di convalida. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

validation:macro_recall

Il punteggio di richiamo del modello finale nel set di dati di convalida. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

validation:mse

L'errore quadratico medio del modello finale nel set di dati di convalida. Questo parametro oggettivo è valido solo per la regressione.

Minimizza

validation:multiclass_accuracy

L'accuratezza del modello finale nel set di dati di convalida. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

validation:multiclass_top_k_accuracy

La accuratezza tra le prime etichette k previste sul set di dati di convalida. Se scegli questo parametro come obiettivo, consigliamo di impostare il valore di k utilizzando l'iperparametro accuracy_top_k. Questo parametro oggettivo è valido solo per la classificazione multiclasse.

Massimizza

validation:objective_loss

Il valore medio della funzione di perdita obiettivo su ogni epoca (Unix epoch) del set di dati di convalida. Per impostazione predefinita, la perdita è la perdita logistica per la classificazione binaria e la perdita al quadrato per la regressione. Per impostare la perdita di altri tipi, utilizza l'iperparametro loss.

Minimizza

validation:precision

La precisione del modello finale nel set di dati di convalida. Se scegli questo parametro come obiettivo, ti consigliamo di impostare una richiamata di target impostando l'iperparametro binary_classifier_model_selection su precision_at_target_recall e il valore per l'iperparametro target_recall. Questo parametro oggettivo è valido solo per la classificazione binaria.

Massimizza

validation:recall

Il richiamo del modello finale nel set di dati di convalida. Se scegli questo parametro come obiettivo, ti consigliamo di impostare una precisione di target impostando l'iperparametro binary_classifier_model_selection su recall_at_target_precision e il valore per l'iperparametro target_precision. Questo parametro oggettivo è valido solo per la classificazione binaria.

Massimizza

validation:rmse

La radice dell'errore quadratico medio del modello finale nel set di dati di convalida. Questo parametro oggettivo è valido solo per la regressione.

Minimizza

validation:roc_auc_score

L'area sotto la curva caratteristica operativa del ricevitore (curva ROC) del modello finale nel set di dati di convalida. Questo parametro oggettivo è valido solo per la classificazione binaria.

Massimizza

Ottimizzazione degli iperparametri di apprendimento lineare

Puoi ottimizzare un modello Linear Learner con i seguenti iperparametri.

Nome parametro Tipo parametro Intervalli consigliati
wd

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

l1

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

learning_rate

ContinuousParameterRanges

MinValue: 1e-5, MaxValue: 1

mini_batch_size

IntegerParameterRanges

MinValue: 100, MaxValue: 5000

use_bias

CategoricalParameterRanges

[True, False]

positive_example_weight_mult

ContinuousParameterRanges

MinValue: 1e-5, MaxValue: 1e5