Ottimizzazione di un modello k-NN - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Ottimizzazione di un modello k-NN

L'algoritmo Amazon SageMaker k-nearest neighbors è un algoritmo supervisionato. L'algoritmo usa un set di dati di test ed emette un parametro sull'accuratezza per un'attività di classificazione o sull'errore quadratico medio per un'attività di regressione. Questi parametri di accuratezza confrontano le previsioni del modello per la rispettiva attività con i dati acquisiti sul campo dai dati di test empirici. Per individuare il modello migliore che restituisce la massima accuratezza o l'errore minore nel set di dati di test, esegui un processo di ottimizzazione iperparametri per k-NN.

L'ottimizzazione automatica dei modelli, nota anche come ottimizzazione degli iperparametri, trova la versione migliore di un modello eseguendo molti processi che testano un intervallo di iperparametri sul set di dati. Scegli gli iperparametri ottimizzabili, un intervallo di valori per ciascuno di essi e un parametro obiettivo. Scegli il parametro obiettivo appropriato per l'attività di previsione dell'algoritmo. L'ottimizzazione automatica del modello ricerca gli iperparametri scelti per trovare la combinazione di valori che restituisce il modello che ottimizza il parametro obiettivo. Gli iperparametri vengono utilizzati solo per aiutare a stimare i parametri del modello e non vengono utilizzati dal modello addestrato per fare previsioni.

Per ulteriori informazioni sull'ottimizzazione del modello, consulta Esegui l'ottimizzazione automatica del modello con SageMaker.

Parametri calcolati dall'algoritmo k-NN

L'algoritmo k-nearest neighbors calcola uno dei due parametri nella tabella seguente durante l’addestramento, a seconda del tipo di attività specificato dall'iperparametro predictor_type.

  • classifier specifica un'attività di classificazione e calcola test:accuracy

  • regressor specifica un'attività di regressione e calcola test:mse.

Scegli il valore predictor_type appropriato per il tipo di attività intrapresa per calcolare il parametro obiettivo pertinente quando si ottimizza un modello.

Nome parametro Descrizione Direzione dell'ottimizzazione
test:accuracy

Quando predictor_type è impostato su classifier, k-NN confronta l'etichetta prevista, in base alla media delle etichette dei k-nearest neighbors, con l'etichetta dei dati acquisiti sul campo fornita nei dati del canale di test. L'accuratezza restituita varia da 0,0 (0%) a 1,0 (100%).

Massimizza

test:mse

Quando predictor_type è impostato su regressor, k-NN confronta l'etichetta prevista, in base alla media delle etichette dei k-nearest neighbors, con l'etichetta dei dati acquisiti sul campo fornita nei dati del canale di test. L'errore quadratico medio viene calcolato confrontando le due etichette.

Minimizza

Iperparametri k-NN ottimizzabili

Ottimizza il modello Amazon SageMaker k-Nearest Neighbor con i seguenti iperparametri.

Nome parametro Tipo parametro Intervalli consigliati
k

IntegerParameterRanges

MinValue: 1, 1024 MaxValue

sample_size

IntegerParameterRanges

MinValue: 256, MaxValue: 20000000