Iperparametri k-NN - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Iperparametri k-NN

La tabella seguente elenca gli iperparametri che puoi impostare per l'algoritmo Amazon SageMaker k-Nearest Neighbors (k-NN).

Nome parametro Descrizione
feature_dim

Il numero di caratteristiche nei dati di input.

Campo obbligatorio

Valori validi: numeri interi positivi.

k

Il numero di neighbors più vicini.

Campo obbligatorio

Valori validi: numeri interi positivi

predictor_type

Il tipo di inferenza da utilizzare sulle etichette dei dati.

Campo obbligatorio

Valori validi: classifier per la classificazione o regressor per la regressione.

sample_size

Il numero di punti di dati da campionare dal set di dati di addestramento.

Campo obbligatorio

Valori validi: numeri interi positivi

dimension_reduction_target

La dimensione di target ridotta da impostare.

Obbligatorio quando viene specificato il parametro dimension_reduction_type.

Valori validi: numeri interi positivi maggiori di 0 e minori di feature_dim.

dimension_reduction_type

Il tipo di metodo di riduzione delle dimensioni.

Opzionale

Valori validi: sign per la proiezione casuale o fjlt per la trasformazione veloce Johnson-Lindenstrauss.

Valore predefinito: nessuna riduzione della dimensione

faiss_index_ivf_nlists

Il numero di centroidi da costruire nell'indice quando è faiss. index_type IVFFlato faiss. IVFPQ.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: auto, che viene risolto in sqrt(sample_size).

faiss_index_pq_m

Il numero di sottocomponenti vettoriali da costruire nell'indice quando index_type è impostato su faiss. IVFPQ.

La libreria FaceBook AI Similarity Search (FAISS) richiede che il valore di faiss_index_pq_m sia un divisore della dimensione dei dati. Se faiss_index_pq_m non è un divisore della dimensione dati, la dimensione dati viene aumentata al più piccolo intero divisibile per faiss_index_pq_m. Se non viene applicata nessuna riduzione di dimensione, l'algoritmo aggiunge un riempimento di zeri. Se viene applicata la riduzione di dimensione, l'algoritmo aumenta il valore dell'iperparametro dimension_reduction_target.

Opzionale

Valori validi: uno dei seguenti numeri interi positivi: 1, 2, 3, 4, 8, 12, 16, 20, 24, 28, 32, 40, 48, 56, 64, 96

index_metric

Il parametro per misurare la distanza tra i punti nella ricerca dei neighbors più vicini. Per l’addestramento con index_type impostato su faiss.IVFPQ, la distanza INNER_PRODUCT e la similarità COSINEnon sono supportate.

Opzionale

Valori validi: L2 per la distanza euclidea, INNER_ PRODUCT per la distanza interna del prodotto, per la somiglianza del coseno. COSINE

Valore predefinito: L2

index_type

Tipo di indice.

Opzionale

Valori validi: faiss.flat, faiss. IVFFlat, faiss. IVFPQ.

Valore predefinito: faiss.Flat

mini_batch_size

Il numero di osservazioni per ogni mini batch per l'iterazione di dati.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 5000