オンデマンド推論にデプロイを使用する
オンデマンド推論用にカスタムモデルをデプロイしたら、それを使用して推論リクエストを実行してレスポンスを生成できます。InvokeModel
または Converse
オペレーションでは、デプロイ Amazon リソースネーム (ARN) を modelId
として使用します。
推論リクエストの実行については、以下のトピックを参照してください。
オンデマンド推論用にカスタムモデルをデプロイしたら、それを使用して推論リクエストを実行してレスポンスを生成できます。InvokeModel
または Converse
オペレーションでは、デプロイ Amazon リソースネーム (ARN) を modelId
として使用します。
推論リクエストの実行については、以下のトピックを参照してください。