LDA ハイパーパラメータ - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

LDA ハイパーパラメータ

CreateTrainingJob リクエストで、トレーニングアルゴリズムを指定します。アルゴリズム固有のハイパーパラメータをマップとして指定することもできます。 string-to-string 次の表は、Amazon が提供する LDA トレーニングアルゴリズムのハイパーパラメータを示しています。 SageMaker詳細については、「LDA の仕組み」を参照してください。

Parameter Name 説明
num_topics

データ内で見つける LDA のトピックの数。

必須

有効な値: 正の整数

feature_dim

入力ドキュメントコーパスの語彙のサイズ。

必須

有効な値: 正の整数

mini_batch_size

入力ドキュメントコーパス内のドキュメントの合計数。

必須

有効な値: 正の整数

alpha0

集中パラメータの最初の推測: 前のディリクレの要素の合計。小さな値ではスパーストピック混在を生成する可能性が高く、大きな値 (1.0 以上) はより均一な混合物を生成します。

オプション

有効な値: 正の浮動小数

デフォルト値: 1.0

max_restarts

アルゴリズムの交互最小二乗法 (ALS) スペクトル分解フェーズで実行する再起動の回数。追加の計算を犠牲にして、より良い品質のローカル最小値を見つけるために使用できますが、通常は調整しないでください。

オプション

有効な値: 正の整数

デフォルト値: 10

max_iterations

アルゴリズムの ALS フェーズで実行する反復の最大回数。追加の計算を犠牲にして、より良い品質の最小値を見つけるために使用できますが、通常は調整しないでください。

オプション

有効な値: 正の整数

デフォルト値: 1000

tol

アルゴリズムの ALS フェーズの目標のエラー許容値。追加の計算を犠牲にして、より良い品質の最小値を見つけるために使用できますが、通常は調整しないでください。

オプション

有効な値: 正の浮動小数

デフォルト値: 1e-8