LDA ハイパーパラメータ - Amazon SageMaker

LDA ハイパーパラメータ

CreateTrainingJob リクエストで、トレーニングアルゴリズムを指定します。また、アルゴリズム固有のハイパーパラメータを文字列から文字列へのマップとして指定することもできます。次の表に、Amazon SageMaker によって提供される LDA トレーニングアルゴリズムのハイパーパラメータを示します。詳細については、「LDA の仕組み」を参照してください。

パラメータ名 説明
num_topics

データ内で見つける LDA のトピックの数。

必須

有効な値: 正の整数

feature_dim

入力ドキュメントコーパスの語彙のサイズ。

必須

有効な値: 正の整数

mini_batch_size

入力ドキュメントコーパス内のドキュメントの合計数。

必須

有効な値: 正の整数

alpha0

集中パラメータの最初の推測: 前のディリクレの要素の合計。小さな値ではスパーストピック混在を生成する可能性が高く、大きな値 (1.0 以上) はより均一な混合物を生成します。

オプション

有効な値: 正の浮動小数

デフォルト値: 1.0

max_restarts

アルゴリズムの交互最小二乗法 (ALS) スペクトル分解フェーズで実行する再起動の回数。追加の計算を犠牲にして、より良い品質のローカル最小値を見つけるために使用できますが、通常は調整しないでください。

オプション

有効な値: 正の整数

デフォルト値: 10

max_iterations

アルゴリズムの ALS フェーズで実行する反復の最大回数。追加の計算を犠牲にして、より良い品質の最小値を見つけるために使用できますが、通常は調整しないでください。

オプション

有効な値: 正の整数

デフォルト値: 1000

tol

アルゴリズムの ALS フェーズの目標のエラー許容値。追加の計算を犠牲にして、より良い品質の最小値を見つけるために使用できますが、通常は調整しないでください。

オプション

有効な値: 正の浮動小数

デフォルト値: 1e-8