Usar uma implantação para inferência sob demanda
Depois de implantar o modelo personalizado para inferência sob demanda, você pode usá-lo para gerar respostas fazendo solicitações de inferência. Para as operações InvokeModel
ou Converse
, você usa o nome do recurso da Amazon (ARN) da implantação como o modelId
.
Para obter informações sobre como fazer solicitações de inferência, consulte os seguintes tópicos: