本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
調校 LDA 模型
自動模型調校,又稱為超參數調校,會透過在您的資料集上,執行許多測試超參數範圍的任務,來尋找最佳版本的模型。您可以選擇可調校的超參數、每一個超參數的值範圍,及目標指標。您可以從演算法運算的指標中選擇目標指標。自動模型調校會搜尋所選擇的超參數,以找出產生之模型可最佳化目標指標的值組合。
LDA 是一種非監督式的主題建模演算法,嘗試將一組觀察項 (文件) 描述為不同類別的混合組合 (主題)。“每字都記錄的機率” (PWLL) 指標會測量已學會之主題集 (LDA 模型) 準確描述測試文件資料集的機率。PWLL 值愈大,表示 LDA 模型愈可能描述測試資料。
如需模型調校的詳細資訊,請參閱使用 自動模型調校 SageMaker。
依 LDA 演算法計算的指標
LDA 演算法在訓練期間針對單一指標報告:test:pwll
。調校模型時,請選擇此指標做為目標指標。
指標名稱 | 描述 | 最佳化方向 |
---|---|---|
test:pwll |
測試資料集的每字都記錄機率。已學會的 LDA 模型準確描述測試資料集的機率。 |
最大化 |
可調校的 LDA 超參數
您可調校 LDA 演算法的下列超參數。alpha0
和 num_topics
兩種超參數都會影響 LDA 目標指標 (test:pwll
)。如果您不熟悉這些超參數的最佳值 (它們會最大化每字都記錄的機率以及產生準確的 LDA 模型),自動模型調校會協助您找到它們。
參數名稱 | 參數類型 | 建議範圍 |
---|---|---|
alpha0 |
ContinuousParameterRanges |
MinValue:零 MaxValue |
num_topics |
IntegerParameterRanges |
MinValue MaxValue:一、 |