レコメンデーションジョブ - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

レコメンデーションジョブ

Amazon SageMaker Inference Recommender は、次の 2 種類のレコメンデーションを行うことができます。

  1. 推論レコメンデーション (Default ジョブタイプ) は、レコメンデーションインスタンスタイプに対して一連のロードテストを実行します。サーバーレスエンドポイントのロードテストを行うこともできます。このタイプのレコメンデーションジョブを起動するには、モデルパッケージの Amazon リソースネーム (ARN) を提供するだけで済みます。推論レコメンデーションジョブは 45 分以内に完了します。

  2. エンドポイントのレコメンデーション (Advanced ジョブタイプ) は、目的の機械学習インスタンスまたはサーバーレスエンドポイントを選択し、カスタムトラフィックパターンを指定して、本番環境要件に基づいてレイテンシーとスループットの要件を指定するカスタムロードテストに基づいています。このジョブの完了には、設定されたジョブ期間とテストされた推論設定の合計数に応じて、平均 2 時間かかります。

どちらのタイプのレコメンデーションも、同じ APIs を使用してジョブを作成、説明、および停止します。出力は、関連する環境変数、コスト、スループット、レイテンシーメトリクスに関連するインスタンス設定のレコメンデーションのリストです。レコメンデーションジョブには初期インスタンス数も用意されており、これを使用して自動スケーリングポリシーを設定できます。2 種類のジョブを区別するには、 SageMaker コンソールまたは を使用してジョブを作成するときに、 を指定Defaultして予備的なエンドポイントレコメンデーションを作成しAPIs、カスタム負荷テストとエンドポイントレコメンデーションAdvancedを指定します。

注記

両方のタイプのレコメンデーションジョブを独自のワークフローで実行する必要はありません。どちらか一方は、他方とは独立して実行できます。

Inference Recommender では、想定インスタンスのリスト、またはモデルデプロイのコスト、スループット、レイテンシーが最適化された上位 5 つのインスタンスタイプを、信頼度スコアとともに提供することもできます。これらのインスタンスは、モデルをデプロイする際に選択できます。Inference Recommender はモデルに対して自動的にベンチマークを行い、想定インスタンスを提供します。これらは予備的なレコメンデーションであるため、より正確な結果を得るには、さらにインスタンスレコメンデーションジョブを実行することをお勧めします。インスタンス候補を表示するには、 SageMaker モデルの詳細ページに移動します。詳細については、「想定インスタンスを即時に入手する」を参照してください。