Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Quando avvii un processo di addestramento con una richiesta CreateTrainingJob
, specifichi un algoritmo di addestramento. È inoltre possibile specificare iperparametri specifici dell'algoritmo come mappe. string-to-string Gli iperparametri dell' BlazingText algoritmo dipendono dalla modalità utilizzata: Word2Vec (senza supervisione) e Text Classification (supervisionata).
Iperparametri Word2Vec
La tabella seguente elenca gli iperparametri per l'algoritmo di addestramento BlazingText Word2Vec fornito da Amazon AI. SageMaker
Nome parametro | Descrizione |
---|---|
mode |
L'architettura Word2vec utilizzata per l’addestramento. Campo obbligatorio Valori validi: |
batch_size |
La dimensione di ogni batch quando Opzionale Valori validi: numeri interi positivi Valore predefinito: 11 |
buckets |
Il numero di bucket hash da utilizzare per le parole secondarie. Opzionale Valori validi: numeri interi positivi Valore predefinito: 2000000 |
epochs |
Il numero di pass completi tramite i dati di addestramento. Opzionale Valori validi: numeri interi positivi Valore predefinito: 5 |
evaluation |
Se il modello addestrato viene valutato utilizzando il test -353. WordSimilarity Opzionale Valori validi: (booleani) Valore predefinito: |
learning_rate |
L'incremento utilizzato per gli aggiornamenti dei parametri. Opzionale Valori validi: float positivi Valore predefinito: 0,05 |
min_char |
Il numero minimo di caratteri da utilizzare per n-grammi di parole secondarie/caratteri. Opzionale Valori validi: numeri interi positivi Valore predefinito: 3 |
min_count |
Le parole che appaiono meno di Opzionale Valori validi: numeri interi non negativi Valore predefinito: 5 |
max_char |
Il numero massimo di caratteri da utilizzare per n-grammi di parole secondarie/caratteri. Opzionale Valori validi: numeri interi positivi Valore predefinito: 6 |
negative_samples |
Il numero di Negative Sample per la strategia Negative Sample Sharing. Opzionale Valori validi: numeri interi positivi Valore predefinito: 5 |
sampling_threshold |
Il limite di occorrenza delle parole. Le parole che appaiono con maggiore frequenza nei dati di addestramento sono casualmente sottocampionate. Opzionale Valori validi: frazioni positive. L'intervallo consigliato è (0, 1e-3) Valore predefinito: 0.0001 |
subwords |
Indica se eseguire o meno l’addestramento degli incorporamenti delle parole secondarie. Opzionale Valori validi: (booleani) Valore predefinito: |
vector_dim |
La dimensione dei vettori di parola che l'algoritmo impara. Opzionale Valori validi: numeri interi positivi Valore predefinito: 100 |
window_size |
Le dimensioni della finestra contestuale. La finestra contestuale è il numero di parole che circondano la parola di target utilizzata per l’addestramento. Opzionale Valori validi: numeri interi positivi Valore predefinito: 5 |
Iperparametri di classificazione del testo
La tabella seguente elenca gli iperparametri per l'algoritmo di training sulla classificazione del testo fornito da Amazon SageMaker AI.
Nota
Sebbene alcuni parametri siano comuni tra la modalità di classificazione del testo e Word2Vec, potrebbero avere significati diversi a seconda del contesto.
Nome parametro | Descrizione |
---|---|
mode |
La modalità di addestramento. Campo obbligatorio Valori validi: |
buckets |
Il numero di bucket hash da utilizzare per n-grammi di parole. Opzionale Valori validi: numeri interi positivi Valore predefinito: 2000000 |
early_stopping |
Indica se interrompere l’addestramento nel caso in cui l'accuratezza della convalida non migliora dopo a numero Opzionale Valori validi: (booleani) Valore predefinito: |
epochs |
Il numero massimo di pass completi tramite i dati di addestramento. Opzionale Valori validi: numeri interi positivi Valore predefinito: 5 |
learning_rate |
L'incremento utilizzato per gli aggiornamenti dei parametri. Opzionale Valori validi: float positivi Valore predefinito: 0,05 |
min_count |
Le parole che appaiono meno di Opzionale Valori validi: numeri interi non negativi Valore predefinito: 5 |
min_epochs |
Il numero minimo di epoche (Unix epochs) da addestrare prima che venga richiamata la logica di arresto precoce. Opzionale Valori validi: numeri interi positivi Valore predefinito: 5 |
patience |
Il numero di epoche (Unix epochs) da attendere prima di applicare l'arresto precoce quando non viene effettuato alcun progresso sul set di convalida. Usato solo quando Opzionale Valori validi: numeri interi positivi Valore predefinito: 4 |
vector_dim |
La dimensione del livello di incorporamento. Opzionale Valori validi: numeri interi positivi Valore predefinito: 100 |
word_ngrams |
Il numero di caratteristiche n-gramma di parole da utilizzare. Opzionale Valori validi: numeri interi positivi Valore predefinito: 2 |