調校 LDA 模型 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

調校 LDA 模型

自動模型調校,又稱為超參數調校,會透過在您的資料集上,執行許多測試超參數範圍的任務,來尋找最佳版本的模型。您可以選擇可調校的超參數、每一個超參數的值範圍,及目標指標。您可以從演算法運算的指標中選擇目標指標。自動模型調校會搜尋所選擇的超參數,以找出產生之模型可最佳化目標指標的值組合。

LDA 是一種非監督式的主題建模演算法,嘗試將一組觀察項 (文件) 描述為不同類別的混合組合 (主題)。“每字都記錄的機率” (PWLL) 指標會測量已學會之主題集 (LDA 模型) 準確描述測試文件資料集的機率。PWLL 值愈大,表示 LDA 模型愈可能描述測試資料。

如需模型調校的詳細資訊,請參閱使用 自動模型調校 SageMaker

依 LDA 演算法計算的指標

LDA 演算法在訓練期間針對單一指標報告:test:pwll。調校模型時,請選擇此指標做為目標指標。

指標名稱 描述 最佳化方向
test:pwll

測試資料集的每字都記錄機率。已學會的 LDA 模型準確描述測試資料集的機率。

最大化

可調校的 LDA 超參數

您可調校 LDA 演算法的下列超參數。alpha0num_topics 兩種超參數都會影響 LDA 目標指標 (test:pwll)。如果您不熟悉這些超參數的最佳值 (它們會最大化每字都記錄的機率以及產生準確的 LDA 模型),自動模型調校會協助您找到它們。

參數名稱 參數類型 建議範圍
alpha0

ContinuousParameterRanges

MinValue:零 MaxValue

num_topics

IntegerParameterRanges

MinValue MaxValue:一、