BlazingText ハイパーパラメータ - Amazon SageMaker

英語の翻訳が提供されている場合で、内容が矛盾する場合には、英語版がオリジナルとして取り扱われます。翻訳は機械翻訳により提供されています。

BlazingText ハイパーパラメータ

CreateTrainingJob リクエストでトレーニングジョブを開始する場合、トレーニングアルゴリズムを指定します。また、アルゴリズム固有のハイパーパラメータを文字列から文字列へのマップとして指定することもできます。BlazingTextアルゴリズムのハイパーパラメータは、使用するモードによって異なります。Word2Vec(教師なし)およびテキスト分類(教師あり)。

Word2Vec ハイパーパラメータ

次の表に、Amazon SageMaker によって提供される BlazingText Word2Vec トレーニングアルゴリズムのハイパーパラメータを示します。

パラメータ名 説明:
mode

Word2vec アーキテクチャは、トレーニングに使用されます。

必須

有効な値 batch_skipgramskipgram、または cbow

batch_size

各バッチのサイズ mode は に設定されます batch_skipgram。 10~20の数字に設定します。

: オプション。

有効な値 正の整数

デフォルト値 11

buckets

サブワードに使用するハッシュバケットの数。

: オプション。

有効な値: 正の整数。

デフォルト値 2000000

epochs

トレーニングデータの完全なパスの数。

: オプション。

有効な値 正の整数

デフォルト値 5*

evaluation

WordSimilarity-353 テストを使用してトレーニング済みのモデルが評価されるかどうか。

: オプション。

有効な値 (ブーリアン) True または False

デフォルト値: True

learning_rate

パラメータ更新に使用されるステップサイズ。

: オプション。

有効な値 陽性フロート

デフォルト値 0.05 USD

min_char

サブワード/文字 n グラムに使用する最小文字数。

: オプション。

有効な値: 正の整数。

デフォルト値 3.

min_count

出現回数が min_count 未満の単語は破棄されます。

: オプション。

有効な値 非負の整数

デフォルト値 5*

max_char

サブワード/文字 n グラムに使用する最大文字数。

: オプション。

有効な値: 正の整数。

デフォルト値 6

negative_samples

Negative Sample Sharing (負のサンプル共有) 戦略の負のサンプル数。

: オプション。

有効な値 正の整数

デフォルト値 5*

sampling_threshold

単語の出現回数のしきい値。トレーニングデータ内でより高い頻度で出現する単語は、ランダムにダウンサンプリングされます。

: オプション。

有効な値 陽性画分。推奨される範囲は (0, 1e-3] です。

デフォルト値 0.0001人

subwords

サブワード埋め込みを学習するかどうか。

: オプション。

有効な値 (ブーリアン) True または False

デフォルト値: False

vector_dim

アルゴリズムが学習する単語ベクトルのディメンション。

: オプション。

有効な値 正の整数

デフォルト値 -100

window_size

コンテキストウィンドウのサイズ。コンテキストウィンドウは、トレーニングに使用されたターゲット単語を囲む単語の数です。

: オプション。

有効な値 正の整数

デフォルト値 5*

テキスト分類ハイパーパラメータ

次の表に、Amazon SageMaker によって提供されるテキスト分類トレーニングアルゴリズムのハイパーパラメータを示します。

注記

テキスト分類モードと Word2Vec モードのパラメータの一部は共通していますが、コンテキストによっては意味が異なる場合があります。

パラメータ名 説明:
mode

トレーニングモード。

必須

有効な値: supervised

buckets

単語 n-gram に使用するハッシュバケットの数。

: オプション。

有効な値 正の整数

デフォルト値 2000000

early_stopping

エポックの patience 数を過ぎても検証の正確性が向上しない場合にトレーニングを中止するかどうか。

: オプション。

有効な値 (ブーリアン) True または False

デフォルト値: False

epochs

トレーニングデータの完全なパスの最大数。

: オプション。

有効な値 正の整数

デフォルト値 5*

learning_rate

パラメータ更新に使用されるステップサイズ。

: オプション。

有効な値 陽性フロート

デフォルト値 0.05 USD

min_count

出現回数が min_count 未満の単語は破棄されます。

: オプション。

有効な値 非負の整数

デフォルト値 5*

min_epochs

早期停止ロジックが呼び出される前にトレーニングするエポックの最小数。

: オプション。

有効な値 正の整数

デフォルト値 5*

patience

検証セットで何も進捗がない場合に、早期停止を適用するまでに待機するエポック数。early_stoppingTrue である場合にのみ使用されます。

: オプション。

有効な値 正の整数

デフォルト値 4.

vector_dim

埋め込みレイヤーのディメンション。

: オプション。

有効な値 正の整数

デフォルト値 -100

word_ngrams

使用する単語 n-gram 機能の数。

: オプション。

有効な値 正の整数

デフォルト値 2.