Usar uma implantação para inferência sob demanda

Depois de implantar o modelo personalizado para inferência sob demanda, você pode usá-lo para gerar respostas fazendo solicitações de inferência. Para as operações InvokeModel ou Converse, você usa o nome do recurso da Amazon (ARN) da implantação como o modelId.

Para obter informações sobre como fazer solicitações de inferência, consulte os seguintes tópicos:

Enviar prompts e gerar respostas com inferência do modelo
Pré-requisitos para executar a inferência do modelo
Enviar prompts e gerar respostas usando a API

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Implantar um modelo personalizado

Excluir uma implantação de modelo personalizado