Hiperparameter LDA - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Hiperparameter LDA

Dalam CreateTrainingJob permintaan, Anda menentukan algoritma pelatihan. Anda juga dapat menentukan hyperparameter khusus algoritme sebagai peta. string-to-string Tabel berikut mencantumkan hyperparameters untuk algoritma pelatihan LDA yang disediakan oleh Amazon. SageMaker Untuk informasi selengkapnya, lihat Bagaimana LDA Bekerja.

Nama Parameter Deskripsi
num_topics

Jumlah topik untuk LDA untuk menemukan dalam data.

Diperlukan

Nilai yang valid: bilangan bulat positif

feature_dim

Ukuran kosakata korpus dokumen input.

Diperlukan

Nilai yang valid: bilangan bulat positif

mini_batch_size

Jumlah total dokumen dalam korpus dokumen input.

Diperlukan

Nilai yang valid: bilangan bulat positif

alpha0

Tebakan awal untuk parameter konsentrasi: jumlah elemen Dirichlet sebelumnya. Nilai kecil lebih cenderung menghasilkan campuran topik yang jarang dan nilai besar (lebih besar dari 1,0) menghasilkan campuran yang lebih seragam.

Opsional

Nilai yang valid: Float positif

Nilai default: 1.0

max_restarts

Jumlah restart untuk dilakukan selama fase dekomposisi spektral Alternating Least Squares (ALS) dari algoritma. Dapat digunakan untuk menemukan minima lokal berkualitas lebih baik dengan mengorbankan perhitungan tambahan, tetapi biasanya tidak boleh disesuaikan.

Opsional

Nilai yang valid: Bilangan bulat positif

Nilai default: 10

max_iterations

Jumlah maksimum iterasi yang harus dilakukan selama fase ALS dari algoritma. Dapat digunakan untuk menemukan kualitas minimum yang lebih baik dengan mengorbankan perhitungan tambahan, tetapi biasanya tidak boleh disesuaikan.

Opsional

Nilai yang valid: Bilangan bulat positif

Nilai default: 1000

tol

Target toleransi kesalahan untuk fase ALS dari algoritma. Dapat digunakan untuk menemukan kualitas minimum yang lebih baik dengan mengorbankan perhitungan tambahan, tetapi biasanya tidak boleh disesuaikan.

Opsional

Nilai yang valid: Float positif

Nilai default: 1e-8