モデルのデプロイ

Amazon SageMaker Neo でコンパイルされたモデルを HTTPS エンドポイントにデプロイするには、Amazon SageMaker AI ホスティングサービスを使用してモデルのエンドポイントを設定および作成する必要があります。現在、デベロッパーは Amazon SageMaker API を使って、モジュールを、ml.c5、ml.c4、ml.m5、ml.m4、ml.p3、ml.p2、ml.inf1 インスタンスにデプロイできます。

Inferentia インスタンスと Trainium インスタンスの場合、モデルはそれらのインスタンス専用にコンパイルする必要があります。他のインスタンスタイプ用にコンパイルされたモデルは、Inferentia インスタンスまたは Trainium インスタンスでの動作は保証されません。

コンパイル済みモデルをデプロイするときは、コンパイルに使用したものと同じインスタンスをターゲットに使用する必要があります。これにより、推論の実行に使用できる SageMaker AI エンドポイントが作成されます。Amazon Amazon SageMaker AI SDK for Python、SDK for Python (Boto3)、、SageMaker AI コンソールのいずれかを使用してAWS Command Line Interface、Neo コンパイル済みモデルをデプロイできます。

注記

AWS CLI、コンソール、または Boto3 を使用してモデルをデプロイするには、「Neo 推論コンテナイメージ」を参照して、プライマリコンテナの推論イメージ URI を選択します。

トピック

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

サポートされるインスタンスタイプとフレームワーク

前提条件