Cookie の設定を選択する

当社は、当社のサイトおよびサービスを提供するために必要な必須 Cookie および類似のツールを使用しています。当社は、パフォーマンス Cookie を使用して匿名の統計情報を収集することで、お客様が当社のサイトをどのように利用しているかを把握し、改善に役立てています。必須 Cookie は無効化できませんが、[カスタマイズ] または [拒否] をクリックしてパフォーマンス Cookie を拒否することはできます。

お客様が同意した場合、AWS および承認された第三者は、Cookie を使用して便利なサイト機能を提供したり、お客様の選択を記憶したり、関連する広告を含む関連コンテンツを表示したりします。すべての必須ではない Cookie を受け入れるか拒否するには、[受け入れる] または [拒否] をクリックしてください。より詳細な選択を行うには、[カスタマイズ] をクリックしてください。

BlazingText ハイパーパラメータ

フォーカスモード
BlazingText ハイパーパラメータ - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

CreateTrainingJob リクエストでトレーニングジョブを開始する場合、トレーニングアルゴリズムを指定します。また、アルゴリズム固有のハイパーパラメータを文字列から文字列へのマップとして指定することもできます。BlazingText アルゴリズムのハイパーパラメータは、Word2Vec (教師なし) とテキスト分類 (教師あり) のどちらのモードを使用しているかによって異なります。

Word2Vec ハイパーパラメータ

次の表に、Amazon SageMaker AI が提供する BlazingText Word2Vec トレーニングアルゴリズムのハイパーパラメータを示します。

Parameter Name 説明
mode

Word2vec アーキテクチャは、トレーニングに使用されます。

必須

有効な値: batch_skipgramskipgram、または cbow

batch_size

modebatch_skipgram に設定されている場合の各バッチのサイズ。10~20 間の数字に設定します。

オプション

有効な値: 正の整数

デフォルト値: 11

buckets

サブワードに使用するハッシュバケットの数。

オプション

有効な値: 正の整数

デフォルト値: 2000000

epochs

トレーニングデータの完全なパスの数。

オプション

有効な値: 正の整数

デフォルト値: 5

evaluation

WordSimilarity-353 テストを使用してトレーニング済みのモデルが評価されるかどうか。

オプション

有効な値: (ブール値) True または False

デフォルト値: True

learning_rate

パラメータ更新に使用されるステップサイズ。

オプション

有効な値: 正の浮動小数

デフォルト値: 0.05

min_char

サブワード/文字 n グラムに使用する最小文字数。

オプション

有効な値: 正の整数

デフォルト値: 3

min_count

出現回数が min_count 未満の単語は破棄されます。

オプション

有効な値: 負以外の整数

デフォルト値: 5

max_char

サブワード/文字 n グラムに使用する最大文字数。

オプション

有効な値: 正の整数

デフォルト値: 6

negative_samples

Negative Sample Sharing (負のサンプル共有) 戦略の負のサンプル数。

オプション

有効な値: 正の整数

デフォルト値: 5

sampling_threshold

単語の出現回数のしきい値。トレーニングデータ内でより高い頻度で出現する単語は、ランダムにダウンサンプリングされます。

オプション

有効な値: 正の小数。推奨される範囲は (0, 1e-3] です。

デフォルト値: 0.0001

subwords

サブワード埋め込みを学習するかどうか。

オプション

有効な値: (ブール値) True または False

デフォルト値: False

vector_dim

アルゴリズムが学習する単語ベクトルのディメンション。

オプション

有効な値: 正の整数

デフォルト値: 100

window_size

コンテキストウィンドウのサイズ。コンテキストウィンドウは、トレーニングに使用されたターゲット単語を囲む単語の数です。

オプション

有効な値: 正の整数

デフォルト値: 5

テキスト分類ハイパーパラメータ

次の表に、Amazon SageMaker AI が提供するテキスト分類トレーニングアルゴリズムのハイパーパラメータを示します。

注記

テキスト分類モードと Word2Vec モードのパラメータの一部は共通していますが、コンテキストによっては意味が異なる場合があります。

Parameter Name 説明
mode

トレーニングモード。

必須

有効な値: supervised

buckets

単語 n-gram に使用するハッシュバケットの数。

オプション

有効な値: 正の整数

デフォルト値: 2000000

early_stopping

エポックの patience 数を過ぎても検証の正確性が向上しない場合にトレーニングを中止するかどうか。早期停止を使用する場合は、検証チャネルが必要であることに注意してください。

オプション

有効な値: (ブール値) True または False

デフォルト値: False

epochs

トレーニングデータの完全なパスの最大数。

オプション

有効な値: 正の整数

デフォルト値: 5

learning_rate

パラメータ更新に使用されるステップサイズ。

オプション

有効な値: 正の浮動小数

デフォルト値: 0.05

min_count

出現回数が min_count 未満の単語は破棄されます。

オプション

有効な値: 負以外の整数

デフォルト値: 5

min_epochs

早期停止ロジックが呼び出される前にトレーニングするエポックの最小数。

オプション

有効な値: 正の整数

デフォルト値: 5

patience

検証セットで何も進捗がない場合に、早期停止を適用するまでに待機するエポック数。early_stoppingTrue である場合にのみ使用されます。

オプション

有効な値: 正の整数

デフォルト値: 4

vector_dim

埋め込みレイヤーのディメンション。

オプション

有効な値: 正の整数

デフォルト値: 100

word_ngrams

使用する単語 n-gram 機能の数。

オプション

有効な値: 正の整数

デフォルト値: 2

プライバシーサイト規約Cookie の設定
© 2025, Amazon Web Services, Inc. or its affiliates.All rights reserved.