オンデマンド推論用のカスタムモデルをデプロイする - Amazon Nova

オンデマンド推論用のカスタムモデルをデプロイする

モデルカスタマイズジョブ (ファインチューニング、蒸留、または継続的な事前トレーニング) でカスタムモデルの作成に成功したら、モデルのオンデマンド推論を設定できます。

カスタムモデルのオンデマンド推論を設定するには、カスタムモデルのデプロイを使用してモデルをデプロイします。カスタムモデルをデプロイしたら、デプロイの Amazon リソースネーム (ARN) を InvokeModel または Converse API オペレーションの modelId パラメータとして使用します。デプロイされたモデルは、プレイグラウンド、エージェント、ナレッジベースなどの Amazon Bedrock 機能でオンデマンド推論に使用できます。

サポートされているモデル

次のモデルに対してオンデマンド推論を設定できます。

  • Amazon Nova Canvas

  • Amazon Nova Lite

  • Amazon Nova Micro

  • Amazon Nova Pro