k-means モデルを調整する

自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、データセットのさまざまなハイパーパラメータをテストする多数のジョブを実行して、モデルの最適なバージョンを見つけます。調整可能なハイパーパラメータ、それぞれの値の範囲、および目標メトリクスを選択します。アルゴリズムが計算するメトリクスから目標メトリクスを選択します。自動モデル調整は、選択されたハイパーパラメータを検索して、目標メトリクスを最適化するモデルになる値の組み合わせを見つけます。

Amazon SageMaker AI k-means アルゴリズムは、データを可能な限り類似したメンバーを持つクラスターにグループ化する教師なしアルゴリズムです。教師なしであるため、ハイパーパラメータの最適化に利用できる検証データセットは使用されません。ただし、テストデータセットを使用して、各トレーニング実行の最後にデータポイントから最終的なクラスターの重心までの距離の 2 乗に依存するメトリクスを出力します。テストデータセットの最も厳密なクラスターを報告するモデルを見つけるには、ハイパーパラメータ調整ジョブを使用します。クラスターはそれらのメンバーの類似性を最適化します。

モデル調整の詳細については、「SageMaker AI による自動モデル調整」を参照してください。

k-means アルゴリズムによって計算されたメトリクス

k-means アルゴリズムは、トレーニング中に以下のメトリクスを計算します。モデルを調整するときに、これらのメトリクスの 1 つを目標メトリクスとして選択します。

メトリクス名	説明	最適化の方向
`test:msd`	テストセット内の各レコードからモデルの最も近い中心までの距離の 2 乗の平均。	最小化
`test:ssd`	テストセット内の各レコードからモデルの最も近い中心までの距離の 2 乗の合計。	最小化

調整可能な k-means ハイパーパラメータ

次のハイパーパラメータを使用して Amazon SageMaker AI k-means モデルを調整します。k-means 目標メトリクスに最も大きな影響を与えるハイパーパラメータは、mini_batch_size、extra_center_factor、および init_method です。ハイパーパラメータ epochs を調整すると、一般的に小さな改善が見られます。

パラメータ名	パラメータタイプ	推奨範囲
`epochs`	IntegerParameterRanges	MinValue: 1、MaxValue: 10
`extra_center_factor`	IntegerParameterRanges	MinValue: 4、MaxValue: 10
`init_method`	CategoricalParameterRanges	['kmeans++', 'random']
`mini_batch_size`	IntegerParameterRanges	MinValue: 3000、MaxValue:15000

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ハイパーパラメータ

推論の形式