RCF モデルを調整する - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

RCF モデルを調整する

自動モデル調整は、ハイパーパラメータ調整またはハイパーパラメータ最適化とも呼ばれ、データセットのさまざまなハイパーパラメータをテストする多数のジョブを実行して、モデルの最適なバージョンを見つけます。調整可能なハイパーパラメータ、それぞれの値の範囲、および目標メトリクスを選択します。アルゴリズムが計算するメトリクスから目標メトリクスを選択します。自動モデル調整は、選択されたハイパーパラメータを検索して、目標メトリクスを最適化するモデルになる値の組み合わせを見つけます。

アマゾン SageMaker RCF アルゴリズムは、ハイパーパラメータの最適化のためにラベル付きテストデータセットを必要とする、教師なしの異常検出アルゴリズムです。RCF は、テストデータポイントの異常スコアを計算し、それらのスコアが平均スコアの標準偏差の 3 倍を超えている場合は、データポイントを異常とラベル付けします。これは 3 シグマ限界法と呼ばれます。F1 スコアは、計算ラベルと実際のラベルの差に基づいて計算されます。ハイパーパラメータ調整ジョブは、そのスコアを最大化するモデルを見つけます。ハイパーパラメータ最適化の成功は、テストデータセットに対する 3 シグマ限界法の適用可能性に依存します。

モデル調整の詳細については、で自動モデル調整を実行する SageMakerを参照してください。

RCF アルゴリズムによって計算されたメトリクス

RCF アルゴリズムは、トレーニング中に以下のメトリクスを計算します。モデルを調整するときには、このメトリクスを目標メトリクスとして選択してください。

メトリクス名 説明 最適化の方向
test:f1

計算ラベルと実際のラベルの差に基づく、テストデータセットの F1 スコア。

最大化

調整可能な RCF ハイパーパラメータ

以下のハイパーパラメータを使用して RCF モデルを調整できます。

Parameter Name パラメータタイプ 推奨範囲
num_samples_per_tree

IntegerParameterRanges

MinValue: 1、MaxValue: 2048

num_trees

IntegerParameterRanges

MinValue: 50、MaxValue: 1000