Iperparametri LDA - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Iperparametri LDA

Nella richiesta CreateTrainingJob puoi specificare l'algoritmo di addestramento. È inoltre possibile specificare iperparametri specifici dell'algoritmo come mappe. string-to-string La tabella seguente elenca gli iperparametri per l'algoritmo di addestramento LDA fornito da Amazon. SageMaker Per ulteriori informazioni, consulta Come funziona LDA.

Nome parametro Descrizione
num_topics

Il numero di argomenti per LDA da trovare all'interno dei dati.

Campo obbligatorio

Valori validi: numeri interi positivi

feature_dim

La dimensione del vocabolario del corpus di documento di input.

Campo obbligatorio

Valori validi: numeri interi positivi

mini_batch_size

Il numero totale di documenti nel corpus di documento di input.

Campo obbligatorio

Valori validi: numeri interi positivi

alpha0

Supposizione iniziale per il parametro di concentrazione: la somma degli elementi del prior Dirichlet. I valori piccoli hanno maggiore probabilità di generare combinazioni di argomenti a densità bassa e valori grandi (maggiori di 1,0) producono combinazioni più uniformi.

Opzionale

Valori validi: float positivi

Valore predefinito: 1.0

max_restarts

Il numero di riavvii da eseguire durante la fase di decomposizione spettrale dei minimi quadrati alternati (ALS) dell'algoritmo. Può essere utilizzato per trovare minima locali di qualità migliore a scapito dell'elaborazione aggiuntiva. Generalmente non richiede alcuna regolazione.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 10

max_iterations

Il numero massimo di iterazioni da eseguire durante la fase ALS dell'algoritmo. Può essere utilizzato per trovare minima di qualità migliore a scapito dell'elaborazione aggiuntiva. Generalmente non richiede alcuna regolazione.

Opzionale

Valori validi: numeri interi positivi

Valore predefinito: 1000

tol

La tolleranza di errore target per la fase ALS dell'algoritmo. Può essere utilizzato per trovare minima di qualità migliore a scapito dell'elaborazione aggiuntiva. Generalmente non richiede alcuna regolazione.

Opzionale

Valori validi: float positivi

Valore predefinito: 1e-8