Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Hiperparameter NTM
Nama Parameter | Deskripsi |
---|---|
|
Ukuran kosakata dari dataset. Diperlukan Nilai yang valid: Bilangan bulat positif (min: 1, maks: 1.000.000) |
num_topics |
Jumlah topik yang diperlukan. Diperlukan Nilai yang valid: Bilangan bulat positif (min: 2, maks: 1000) |
batch_norm |
Apakah akan menggunakan normalisasi batch selama pelatihan. Opsional Nilai yang valid: benar atau salah Nilai default: false |
clip_gradient |
Besarnya maksimum untuk setiap komponen gradien. Opsional Nilai yang valid: Float (min: 1e-3) Nilai default: Infinity |
encoder_layers |
Jumlah lapisan dalam encoder dan ukuran output dari setiap lapisan. Ketika diatur ke auto, algoritma menggunakan dua lapisan ukuran 3 x Opsional Nilai yang valid: Daftar bilangan bulat positif atau auto yang dipisahkan koma Nilai default: auto |
encoder_layers_activation |
Fungsi aktivasi untuk digunakan dalam lapisan encoder. Opsional Nilai yang valid:
Nilai default: |
epochs |
Jumlah maksimum lintasan atas data pelatihan. Opsional Nilai yang valid: Bilangan bulat positif (min: 1) Nilai default: 50 |
learning_rate |
Tingkat pembelajaran untuk pengoptimal. Opsional Nilai yang valid: Float (min: 1e-6, maks: 1.0) Nilai default: 0,001 |
mini_batch_size |
Jumlah contoh di setiap batch mini. Opsional Nilai yang valid: Bilangan bulat positif (min: 1, maks: 10000) Nilai default: 256 |
num_patience_epochs |
Jumlah zaman berturut-turut di mana kriteria penghentian awal dievaluasi. Penghentian awal dipicu ketika perubahan fungsi kerugian turun di bawah yang ditentukan Opsional Nilai yang valid: Bilangan bulat positif (min: 1) Nilai default: 3 |
optimizer |
Pengoptimal untuk digunakan untuk pelatihan. Opsional Nilai yang valid:
Nilai default: |
rescale_gradient |
Faktor penskalaan ulang untuk gradien. Opsional Nilai yang valid: float (min: 1e-3, maks: 1.0) Nilai default: 1.0 |
sub_sample |
Fraksi data pelatihan untuk sampel untuk pelatihan per zaman. Opsional Nilai yang valid: Float (min: 0.0, max: 1.0) Nilai default: 1.0 |
tolerance |
Perubahan relatif maksimum dalam fungsi kerugian. Penghentian awal dipicu ketika perubahan fungsi kerugian turun di bawah nilai ini dalam Opsional Nilai yang valid: Float (min: 1e-6, maks: 0.1) Nilai default: 0,001 |
weight_decay |
Koefisien peluruhan berat. Menambahkan regularisasi L2. Opsional Nilai yang valid: Float (min: 0.0, max: 1.0) Nilai default: 0.0 |