As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Invoque um agente em linha
nota
A configuração e a invocação de um recurso de agente em linha estão na versão prévia do Amazon Bedrock e estão sujeitas a alterações.
Antes de chamar seu agente em linha, verifique se você preencheu os pré-requisitos.
Para invocar um agente em linha, envie uma solicitação de InvokeInlineAgentAPI com um endpoint de tempo de execução do Agents for Amazon Bedrock e inclua minimamente os seguintes campos.
Campo | Caso de uso |
---|---|
instruction | Forneça instruções que digam ao agente embutido o que ele deve fazer e como ele deve interagir com os usuários. |
foundationModel | Especifique um modelo básico a ser usado para orquestração pelo agente embutido que você cria. Por exemplo, claude antrópica, meta Llama3.1, etc. |
sessionId | Um identificador exclusivo da sessão. Use o mesmo valor em todas as solicitações para continuar a mesma conversa. |
Os seguintes campos são opcionais:
Campo | Caso de uso |
---|---|
Grupos de ação | Lista de grupos de ação com cada grupo de ação definindo as ações que o agente embutido pode realizar. |
knowledgeBases | Associações da base de conhecimento com o agente em linha para aumentar a resposta gerada pelo modelo. |
guardrailConfiguration | Configurações de guardrail para bloquear tópicos, evitar alucinações e implementar proteções para seu aplicativo. |
Colaboração de agentes | Define como o agente colaborador lida com as informações de vários agentes colaboradores para coordenar uma resposta final. O agente colaborador também pode ser o supervisor. |
Configurações do colaborador | Configurações para agente colaborador. |
colaboradores | Lista de agentes colaboradores. |
promptOverrideConfiguration | Configurações para solicitações avançadas usadas para substituir as solicitações padrão. |
enableTrace | Especifique se deseja ativar ou não o rastreamento do processo de raciocínio do agente em linha. |
Segundos da sessão ociosa TTLIn | Especifique a duração após a qual o agente embutido deve encerrar a sessão e excluir todas as informações armazenadas. |
customerEncryptionKeyArn | Especifique o ARN de uma chave KMS para criptografar os recursos do agente, |
endSession | Especifique se deseja encerrar a sessão com o agente embutido ou não. |
inlineSessionState | Parâmetros que especificam os vários atributos de uma sessão. |
inputText | Especifique o texto do aviso a ser enviado ao agente. |
reasoning_config | Habilitar o raciocínio do modelo para que o modelo explique como chegou às suas conclusões. Use dentro de um additionalModelRequestFields campo. Você deve especificar o número budget_tokens que é usado para o raciocínio do modelo, que são um subconjunto dos tokens de saída. Para obter mais informações, consulte Aprimorar as respostas do modelo com o raciocínio do modelo. |
O exemplo de InvokeInlineAgent
API a seguir fornece configurações completas de agentes em linha, incluindo o modelo básico, instruções, grupos de ação com interpretador de código, grades de proteção e bases de conhecimento.
response = bedrock_agent_runtime.invoke_inline_agent( // Initialization parameters: cannot be changed for a conversation sessionId='uniqueSessionId', customerEncryptionKeyArn: String, // Input inputText="Hello, can you help me with a task?", endSession=False, enableTrace=True, // Agent configurations foundationModel='anthropic.claude-3-7-sonnet-20250219-v1:0', instruction="You are a helpful assistant...", actionGroups=[ { 'name': 'CodeInterpreterAction', 'parentActionGroupSignature': 'AMAZON.CodeInterpreter' }, { 'actionGroupName': 'FetchDetails', 'parentActionGroupSignature': '', "actionGroupExecutor": { ... }, "apiSchema": { ... }, "description": "string", "functionSchema": { ... } } ], knowledgeBases=[ { knowledgeBaseId: "string", description: 'Use this KB to get all the info', retrievalConfiguration: { vectorSearchConfiguration: { filter: { ... }, numberOfResults: number, overrideSearchType: "string" } } } ], guardrailConfiguration={ guardrailIdentifier: 'BlockEverything', gurardrailVersion: '1.0' }, promptOverrideConfiguration: {...} // session properties: persisted throughout conversation inlineSessionState = { sessionAttributes = { 'key': 'value' }, promptSessionAttributes = {k:v}, returnControlInvocationResults = {...}, invocationId = 'abc', files = {...}, } }
Você pode incluir parâmetros de raciocínio do modelo na solicitação. A seguir está um exemplo de um único prompt que ativa o raciocínio do modelo noadditionalModelRequestFields
.
{ "basePromptTemplate": " ... ", "inferenceConfiguration": { "stopSequences": [ "</answer>" ] }, "parserMode": "DEFAULT", "promptCreationMode": "DEFAULT", "promptState": "DISABLED", "promptType": "ORCHESTRATION", "additionalModelRequestFields": "reasoning_config": { "type": "enabled", "budget_tokens": 1024 } }