Come funziona Agenti per Amazon Bedrock - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Come funziona Agenti per Amazon Bedrock

Agents for Amazon Bedrock è costituito dai seguenti due set principali di operazioni API per aiutarti a configurare ed eseguire un agente:

Configurazione in fase di compilazione

Un agente è costituito dai componenti seguenti:

  • Modello di base: si sceglie un modello di base (FM) che l'agente richiama per interpretare l'input dell'utente e le istruzioni successive nel processo di orchestrazione. L'agente richiama inoltre l'FM per generare risposte e fasi successive del processo.

  • Istruzioni: scrivi istruzioni che descrivono ciò per cui l'agente è progettato. Con i prompt avanzati, puoi personalizzare ulteriormente le istruzioni per l'agente in ogni fase dell'orchestrazione e includere funzioni Lambda per analizzare l'output di ogni fase.

  • Almeno uno dei seguenti:

    • Gruppi di azioni: si definiscono le azioni che l'agente deve eseguire per l'utente (fornendo le seguenti risorse):

      • Uno dei seguenti schemi per definire i parametri che l'agente deve ottenere dall'utente (ogni gruppo di azioni può utilizzare uno schema diverso):

        • Uno OpenAPI schema per definire le operazioni API che l'agente può richiamare per eseguire le proprie attività. Lo OpenAPI schema include i parametri che devono essere richiesti all'utente.

        • Uno schema dettagliato delle funzioni per definire i parametri che l'agente può richiedere all'utente. Questi parametri possono quindi essere utilizzati per un'ulteriore orchestrazione da parte dell'agente oppure è possibile impostare come utilizzarli nella propria applicazione.

      • (Opzionale) Una funzione Lambda con i seguenti input e output:

        • Input: l'operazione e/o i parametri dell'API identificati durante l'orchestrazione.

        • Output: la risposta dalla chiamata all'API .

    • Basi di conoscenza: associa le basi di conoscenza a un agente. L'agente interroga la Knowledge Base per ottenere ulteriori informazioni in modo da aumentare la generazione di risposte e l'input nelle fasi del processo di orchestrazione.

  • Modelli di prompt: i modelli di prompt sono la base per la creazione di prompt da fornire all'FM. Agents for Amazon Bedrock espone i quattro modelli di prompt di base predefiniti utilizzati durante la pre-elaborazione, l'orchestrazione, la generazione di risposte della knowledge base e la post-elaborazione. Facoltativamente, puoi modificare questi modelli di prompt di base per personalizzare il comportamento dell'agente in ogni fase della sequenza. Puoi anche disattivare i passaggi per la risoluzione dei problemi o se ritieni che un passaggio non sia necessario. Per ulteriori informazioni, consulta Istruzioni avanzate in Amazon Bedrock.

In fase di compilazione, tutti questi componenti vengono raccolti per creare istruzioni di base affinché l'agente esegua l'orchestrazione fino al completamento della richiesta dell'utente. Con i prompt avanzati, puoi modificare questi prompt di base con logica aggiuntiva ed esempi con poche informazioni per migliorare la precisione di ogni passaggio dell'invocazione dell'agente. I modelli di prompt di base contengono istruzioni, descrizioni delle azioni, descrizioni della knowledge base e cronologia delle conversazioni, tutte personalizzabili per modificare l'agente in base alle proprie esigenze. Quindi preparate l'agente, che impacchetta tutti i componenti degli agenti, comprese le configurazioni di sicurezza. La preparazione dell'agente lo porta in uno stato in cui può essere testato in fase di esecuzione. L'immagine seguente mostra come le operazioni API in fase di compilazione costruiscono l'agente.

In che modo le API in fase di compilazione costruiscono il tuo agente. Un gruppo di azioni è costituito da uno OpenAPI schema e da una funzione Lambda per definire quali operazioni API un agente può chiamare e come l'agente deve gestire le richieste e le risposte. L'agente sintetizza le informazioni dai modelli di prompt di base, dalle istruzioni fornite e da eventuali gruppi di azioni e knowledge base allegati per generare prompt con il modello utilizzato. I prompt vengono aggiunti al prompt store dell'agente.

Processo di runtime

Il runtime è gestito dall'operazione InvokeAgentAPI. Questa operazione avvia la sequenza degli agenti, che consiste nei tre passaggi principali seguenti.

  1. Preelaborazione: gestisce il modo in cui l'agente contestualizza e classifica l'input dell'utente e può essere utilizzato per convalidare l'input.

  2. Orchestrazione: interpreta l'input dell'utente, richiama gruppi di azioni e interroga le knowledge base e restituisce l'output all'utente o come input per un'orchestrazione continua. L'orchestrazione consiste nei seguenti passaggi:

    1. L'agente interpreta l'input con un modello di fondazione e genera una logica per il passaggio successivo da intraprendere.

    2. L'agente prevede quale azione in un gruppo di azioni deve invocare o su quale knowledge base deve interrogare.

    3. Se l'agente prevede di dover richiamare un'azione, invia i parametri, determinati dal prompt dell'utente, alla funzione Lambda configurata per il gruppo di azioni o restituisce il controllo inviando i parametri nella risposta. InvokeAgent Se l'agente non dispone di informazioni sufficienti per richiamare l'azione, potrebbe eseguire una delle seguenti azioni:

      • Interroga una knowledge base associata (Knowledge base response generation) per recuperare un contesto aggiuntivo e riepilogare i dati per aumentarne la generazione.

      • Richiede nuovamente all'utente di raccogliere tutti i parametri richiesti per l'azione.

    4. L'agente genera un output, noto come osservazione, dall'invocazione di un'azione e/o dal riepilogo dei risultati di una knowledge base. L'agente utilizza l'osservazione per aumentare il prompt di base, che viene poi interpretato con un modello di fondazione. L'agente determina quindi se è necessario reiterare il processo di orchestrazione.

    5. Questo ciclo continua finché l'agente non restituisce una risposta all'utente o finché non è necessario richiedere all'utente ulteriori informazioni.

    Durante l'orchestrazione, il modello di prompt di base viene arricchito con le istruzioni dell'agente, i gruppi di azioni e le knowledge base che avete aggiunto all'agente. Quindi, l'augmented base prompt viene utilizzato per richiamare la FM. L'FM prevede i passi e la traiettoria migliori possibili per soddisfare l'input dell'utente. Ad ogni iterazione dell'orchestrazione, la FM prevede l'operazione API da richiamare o la knowledge base da interrogare.

  3. Postelaborazione: l'agente formatta la risposta finale da restituire all'utente. Per impostazione predefinita, questo passaggio è disabilitato.

Quando richiami il tuo agente, puoi attivare una traccia in fase di esecuzione. Con la traccia, puoi tenere traccia delle motivazioni, delle azioni, delle domande e delle osservazioni dell'agente in ogni fase della sequenza dell'agente. La traccia include il prompt completo inviato al modello di base in ogni fase e gli output del modello di base, le risposte API e le query della knowledge base. È possibile utilizzare la traccia per comprendere il ragionamento dell'agente in ogni fase. Per ulteriori informazioni, consulta Tieni traccia degli eventi in Amazon Bedrock

Man mano che la sessione utente con l'agente continua a ricevere più InvokeAgent richieste, la cronologia delle conversazioni viene preservata. La cronologia delle conversazioni amplia continuamente il modello di prompt di orchestrazione di base con il contesto, contribuendo a migliorare la precisione e le prestazioni dell'agente. Il diagramma seguente mostra il processo dell'agente durante il runtime:

Come funziona l'agente in fase di esecuzione. Dopo aver ricevuto l'input dell'utente, l'agente recupera le istruzioni aumentate dal prompt store e la cronologia delle conversazioni dall'archivio delle sessioni. Se la fase di preelaborazione è abilitata, l'agente richiama l'FM con il prompt di preelaborazione per convalidare l'input dell'utente. Nella fase di orchestrazione, l'agente richiama l'FM con il prompt di orchestrazione e analizza la risposta. Quindi determina i gruppi di azione e interroga le basi di conoscenza, se necessario, e genera un'osservazione che potrebbe attivare un nuovo prompt di orchestrazione. La fase di orchestrazione si ripete finché l'osservazione non restituisce una risposta finale all'utente.