Comment fonctionne Amazon Bedrock Agents - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Comment fonctionne Amazon Bedrock Agents

Amazon Bedrock Agents comprend les deux principaux ensembles d'APIopérations suivants pour vous aider à configurer et à gérer un agent :

  • APIOpérations prédéfinies pour créer, configurer et gérer vos agents et leurs ressources associées

  • APIOpérations d'exécution pour appeler votre agent à l'aide des données saisies par l'utilisateur et pour lancer l'orchestration nécessaire à l'exécution d'une tâche.

Configuration au moment de la construction

Un agent se compose des éléments suivants :

  • Modèle de base : vous choisissez un modèle de base (FM) que l'agent invoque pour interpréter les entrées de l'utilisateur et les instructions suivantes dans son processus d'orchestration. L'agent invoque également le FM pour générer des réponses et des étapes de suivi de son processus.

  • Instructions — Vous rédigez des instructions qui décrivent ce pour quoi l'agent est conçu. Grâce aux instructions avancées, vous pouvez personnaliser davantage les instructions pour l'agent à chaque étape de l'orchestration et inclure des fonctions Lambda pour analyser le résultat de chaque étape.

  • Au moins l'un des éléments suivants :

    • Groupes d'actions : vous définissez les actions que l'agent doit effectuer pour l'utilisateur (en fournissant les ressources suivantes) :

      • L'un des schémas suivants pour définir les paramètres que l'agent doit obtenir de l'utilisateur (chaque groupe d'actions peut utiliser un schéma différent) :

        • Un OpenAPI schéma pour définir les API opérations que l'agent peut invoquer pour effectuer ses tâches. Le OpenAPI Le schéma inclut les paramètres qui doivent être obtenus auprès de l'utilisateur.

        • Schéma détaillé des fonctions pour définir les paramètres que l'agent peut obtenir de l'utilisateur. Ces paramètres peuvent ensuite être utilisés pour une orchestration plus poussée par l'agent, ou vous pouvez définir comment les utiliser dans votre propre application.

      • (Facultatif) Une fonction Lambda avec les entrées et sorties suivantes :

        • Entrée : API opération et/ou paramètres identifiés lors de l'orchestration.

        • Sortie — La réponse à l'APIinvocation .

    • Bases de connaissances : associez des bases de connaissances à un agent. L'agent interroge la base de connaissances pour obtenir un contexte supplémentaire afin d'améliorer la génération de réponses et leur saisie dans les étapes du processus d'orchestration.

  • Modèles d'invite — Les modèles d'invite sont à la base de la création d'invites à fournir au FM. Amazon Bedrock Agents expose les quatre modèles d'invite de base par défaut utilisés lors du prétraitement, de l'orchestration, de la génération des réponses de la base de connaissances et du post-traitement. Vous pouvez éventuellement modifier ces modèles d'invite de base pour personnaliser le comportement de votre agent à chaque étape de sa séquence. Vous pouvez également désactiver les étapes à des fins de résolution des problèmes ou si vous décidez qu'une étape n'est pas nécessaire. Pour de plus amples informations, veuillez consulter Améliorez la précision des agents à l'aide de modèles d'invite avancés dans Amazon Bedrock.

Au moment de la création, tous ces composants sont rassemblés pour créer des instructions de base permettant à l'agent d'effectuer l'orchestration jusqu'à ce que la demande de l'utilisateur soit terminée. Grâce aux invites avancées, vous pouvez modifier ces invites de base à l’aide d’une logique supplémentaire et de quelques exemples pour améliorer la précision de chaque étape de l’invocation de l’agent. Les modèles d'invite de base contiennent des instructions, des descriptions d'actions, des descriptions de la base de connaissances et un historique des conversations, que vous pouvez personnaliser pour modifier l'agent en fonction de vos besoins. Vous préparez ensuite votre agent, qui regroupe tous les composants des agents, y compris les configurations de sécurité. La préparation de l'agent le place dans un état dans lequel il peut être testé lors de l'exécution. L'image suivante montre comment les API opérations de construction construisent votre agent.

Comment construisez votre agent au moment de la APIs construction. Un groupe d'action est composé d'un OpenAPI schéma et fonction Lambda pour définir les API opérations qu'un agent peut appeler et comment l'agent doit traiter les demandes et les réponses. L'agent synthétise les informations à partir des modèles d'invite de base, des instructions qui lui sont fournies et de tous les groupes d'action et bases de connaissances associés pour générer des invites avec le modèle qu'il utilise. Les invites sont ajoutées à la banque d'instructions de l'agent.

Processus d'exécution

Le temps d'exécution est géré par le InvokeAgentAPIopération. Cette opération lance la séquence d'agents, qui comprend les trois étapes principales suivantes.

  1. Prétraitement : gère la manière dont l'agent contextualise et catégorise les entrées utilisateur et peut être utilisé pour valider les entrées.

  2. Orchestration : interprète les entrées de l'utilisateur, invoque des groupes d'action et interroge les bases de connaissances, et renvoie les résultats à l'utilisateur ou en tant qu'entrée pour une orchestration continue. L'orchestration comprend les étapes suivantes :

    1. L’agent interprète l’entrée à l’aide d’un modèle de fondation et génère une justification qui expose la logique pour la prochaine étape à suivre.

    2. L'agent prédit l'action d'un groupe d'actions qu'il doit invoquer ou la base de connaissances qu'il doit interroger.

    3. Si l'agent prédit qu'il doit invoquer une action, il envoie les paramètres, déterminés à partir de l'invite de l'utilisateur, à la fonction Lambda configurée pour le groupe d'actions ou renvoie le contrôle en envoyant les paramètres dans le InvokeAgentréponse. Si l'agent ne dispose pas de suffisamment d'informations pour invoquer l'action, il peut effectuer l'une des actions suivantes :

      • Interrogez une base de connaissances associée (génération de réponses dans la base de connaissances) pour récupérer du contexte supplémentaire et synthétiser les données afin d'augmenter leur génération.

      • Demandez à nouveau à l'utilisateur de rassembler tous les paramètres requis pour l'action.

    4. L'agent génère une sortie, connue sous le nom d'observation, en invoquant une action et/ou en résumant les résultats d'une base de connaissances. L’agent utilise l’observation pour compléter l’invite de base, qui sera ensuite interprétée à l’aide d’un modèle de fondation. L’agent détermine ensuite s’il doit réitérer le processus d’orchestration.

    5. Cette boucle continue jusqu'à ce que l'agent renvoie une réponse à l'utilisateur ou jusqu'à ce qu'il doive demander des informations supplémentaires à l'utilisateur.

    Au cours de l'orchestration, le modèle d'invite de base est complété par les instructions de l'agent, les groupes d'actions et les bases de connaissances que vous avez ajoutés à l'agent. Ensuite, l'invite de base augmentée est utilisée pour appeler le FM. Le FM prédit les meilleures étapes et trajectoires possibles pour répondre aux demandes de l'utilisateur. À chaque itération d'orchestration, le FM prédit l'APIopération à invoquer ou la base de connaissances à interroger.

  3. Post-traitement — L'agent met en forme la réponse finale à renvoyer à l'utilisateur. Cette étape est désactivée par défaut.

Lorsque vous appelez votre agent, vous pouvez activer une trace lors de l'exécution. Grâce à la trace, vous pouvez suivre le raisonnement, les actions, les requêtes et les observations de l'agent à chaque étape de la séquence d'agents. Le suivi inclut l'invite complète envoyée au modèle de base à chaque étape et les résultats du modèle de base, les API réponses et les requêtes de la base de connaissances. Vous pouvez utiliser le traçage pour comprendre le raisonnement de l'agent à chaque étape. Pour plus d’informations, consultez Suivez le processus de step-by-step raisonnement de l'agent à l'aide de Trace.

Au fur et à mesure que la session utilisateur avec l'agent se poursuit suite à de nouvelles InvokeAgent demandes, l'historique des conversations est préservé. L'historique des conversations enrichit continuellement le modèle d'invite de base d'orchestration en fonction du contexte, ce qui contribue à améliorer la précision et les performances de l'agent. Le schéma suivant montre le processus de l'agent pendant l'exécution :

Comment fonctionne votre agent pendant l'exécution. Après avoir reçu les informations de l'utilisateur, l'agent extrait les instructions augmentées dans le magasin d'instructions et l'historique des conversations dans le magasin de sessions. Si l'étape de prétraitement est activée, l'agent appelle le FM avec l'invite de prétraitement pour valider les entrées de l'utilisateur. Au cours de l'étape d'orchestration, l'agent appelle le FM avec l'invite d'orchestration et analyse la réponse. Il détermine ensuite les groupes d'action et interroge les bases de connaissances si nécessaire et génère une observation susceptible de déclencher une nouvelle invite d'orchestration. La phase d'orchestration tourne en boucle jusqu'à ce que l'observation renvoie une réponse finale à l'utilisateur.