オンデマンド推論用のカスタムモデルをデプロイする

モデルカスタマイズジョブ (ファインチューニング、蒸留、または継続的な事前トレーニング) でカスタムモデルの作成に成功したら、モデルのオンデマンド推論を設定できます。

カスタムモデルのオンデマンド推論を設定するには、カスタムモデルのデプロイを使用してモデルをデプロイします。カスタムモデルをデプロイしたら、デプロイの Amazon リソースネーム (ARN) を InvokeModel または Converse API オペレーションの modelId パラメータとして使用します。デプロイされたモデルは、プレイグラウンド、エージェント、ナレッジベースなどの Amazon Bedrock 機能でオンデマンド推論に使用できます。