Amazon SageMaker Inference Recommender

Amazon SageMaker Inference Recommender は Amazon SageMaker AI の一機能です。これにより、SageMaker AI ML インスタンス間で負荷テストとモデルチューニングを自動化することで、本番環境で機械学習 (ML) モデルを取得するために必要な時間を短縮できます。Inference Recommender を使用して、リアルタイムまたはサーバーレスの推論エンドポイントにモデルをデプロイすれば、最小のコストでベストパフォーマンスを実現できます。Inference Recommender は、機械学習モデルとワークロードに最適なインスタンスタイプと設定を選択するのに役立ちます。インスタンス数、コンテナパラメータ、モデル最適化、最大同時実行数、メモリサイズなどの要因を考慮します。

Amazon SageMaker Inference Recommender は、ジョブの実行中に使用されたインスタンスに対してのみ課金されます。

仕組み

Amazon SageMaker Inference Recommender を使用するには、SageMaker AI モデルを作成するか、モデルアーティファクトを使用して SageMaker Model Registry にモデルを登録します。 AWS SDK for Python (Boto3) または SageMaker AI コンソールを使用して、さまざまな SageMaker AI エンドポイント設定のベンチマークジョブを実行します。推論レコメンダージョブは、パフォーマンスとリソース使用率に関するメトリクスを収集して視覚化し、どのエンドポイントタイプと構成を選択するかを決定するのに役立ちます。

開始方法

Amazon SageMaker Inference Recommender を初めて使用する方には、次のことをお勧めします。

「Amazon SageMaker Inference Recommender を使用するための前提条件」セクションを参照し、Amazon SageMaker Inference Recommender を使用するための要件を満たしていることを確認します。
「Amazon SageMaker Inference Recommender を使用したレコメンデーションジョブ」セクションを参照し、最初の推論レコメンダーのレコメンデーションジョブを開始します。
入門者向けの Amazon SageMaker Inference Recommender Jupyter Notebook の例を試すか、次のセクションでノートブックのサンプルを確認してください。

サンプルノートブックの例

以下の Jupyter Notebook の例は、Inference Recommender の複数のユースケースのワークフローに役立ちます。

TensorFlow モデルをベンチマークする入門用ノートブックが必要な場合は、SageMaker Inference Recommender TensorFlow ノートブックを参照してください。
HuggingFace モデルをベンチマークする場合は、SageMaker Inference Recommender for HuggingFace ノートブックを参照してください。
XGBoost モデルをベンチマークする場合は、SageMaker Inference Recommender XGBoost ノートブックを参照してください。
Inference Recommender のジョブの CloudWatch メトリクスを確認する場合は、SageMaker Inference Recommender CloudWatch メトリクスノートブックを参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

モデルを評価するためのオプション

前提条件