IP Insights モデルを調整する - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

IP Insights モデルを調整する

ハイパーパラメータ調整とも呼ばれるモデル自動調整は、モデルの最適なバージョンを見つけるために、データセットに対してさまざまなハイパーパラメータをテストする多数のジョブを実行します。調整可能なハイパーパラメータ、それぞれの値の範囲、および目標メトリクスを選択します。アルゴリズムが計算するメトリクスから目標メトリクスを選択します。自動モデル調整は、選択されたハイパーパラメータを検索して、目標メトリクスを最適化するモデルになる値の組み合わせを見つけます。

モデル調整の詳細については、「でモデルの自動チューニングを実行する SageMaker」を参照してください。

IP Insights アルゴリズムによって計算されたメトリクス

Amazon SageMaker IP Insights アルゴリズムは、IP アドレスとエンティティ間の関連を学習する教師なしの学習アルゴリズムです。このアルゴリズムは、観測されたデータポイント (正のサンプル) をランダムに生成されたデータポイント (負のサンプル) と区別することを学習する識別子モデルをトレーニングします。IP Insights の自動モデル調整は、ラベルなしの検証データと自動的に生成された負のサンプルを最も正確に区別できるモデルを見つけるのに役立ちます。検証データセットのモデル精度は、受信者動作特性曲線下面積によって測定されます。この validation:discriminator_auc メトリクスは、0.0 ~ 1.0 の値をとることができます。ここで、1.0 は完全な精度を示します。

IP Insights アルゴリズムは、検証時に validation:discriminator_auc メトリクスを計算します。その値は、ハイパーパラメータ調整を最適化する目標関数として使用されます。

メトリクス名 説明 最適化の方向
validation:discriminator_auc

検証データセットの受信者動作特性曲線の下の領域。検証データセットはラベル付けされません。曲線下面積 (AUC) は、検証データポイントとランダムに生成されたデータポイントを区別するモデルの能力を表すメトリクスです。

最大化

調整可能な IP Insights ハイパーパラメータ

IP Insights アルゴリズムでは、以下のハイパーパラメータを調整できます。 SageMaker

Parameter Name パラメータタイプ 推奨範囲
epochs

IntegerParameterRange

MinValue: 1, MaxValue: 100

learning_rate

ContinuousParameterRange

MinValue: 1e-4、 MaxValue:0.1

mini_batch_size

IntegerParameterRanges

MinValue: 100、 MaxValue:50000

num_entity_vectors

IntegerParameterRanges

MinValue: 10000、 MaxValue:1000000

num_ip_encoder_layers

IntegerParameterRanges

MinValue: 1、 MaxValue:10

random_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue: 10

shuffled_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue: 10

vector_dim

IntegerParameterRanges

MinValue: 8, MaxValue: 256

weight_decay

ContinuousParameterRange

MinValue: 0.0、 MaxValue:1.0