Qu’est-ce que l’ingénierie de requête ?

L'ingénierie rapide fait référence à la pratique consistant à créer et à optimiser des invites de saisie en sélectionnant les mots, les phrases, les signes de ponctuation et les caractères de séparation appropriés à utiliser efficacement LLMs pour une grande variété d'applications. En d’autres termes, l’ingénierie de requête est l’art de communiquer avec un LLM. Les invites de haute qualité conditionnent le LLM pour qu’il génère les réponses souhaitées ou les plus adaptées. Les instructions détaillées fournies dans ce document sont applicables à l'ensemble LLMs d'Amazon Bedrock.

L’approche d’ingénierie de requête la plus efficace pour votre cas d’utilisation dépend à la fois de la tâche et des données. Les tâches courantes prises en charge par Bedrock LLMs sur Amazon sont les suivantes :

Classification : l’invite inclut une question avec plusieurs choix de réponse possibles, et le modèle doit répondre avec le choix approprié. L’analyse du sentiment est un exemple de cas d’utilisation de la classification : l’entrée est un passage de texte, et le modèle doit classer le sentiment du texte (positif ou négatif, inoffensif ou toxique, par exemple).
Question-réponse, sans contexte : le modèle doit répondre à la question avec ses connaissances internes, sans contexte ni document.
Question-réponse, avec contexte : l’utilisateur fournit un texte d’entrée avec une question, et le modèle doit y répondre en fonction des informations fournies dans le texte d’entrée.
Résumé : l’invite est un passage de texte, et le modèle doit répondre par un passage plus court qui capture les points principaux de l’entrée.
Génération de texte ouvert : à l’envoi d’une invite, le modèle doit répondre par un passage de texte original correspondant à la description. Cela comprend également la génération de textes créatifs tels que des histoires, des poèmes ou des scénarios de films.
Génération de code : le modèle doit générer du code en fonction des spécifications de l’utilisateur. Par exemple, une invite peut demander text-to-SQL ou générer du code Python.
Mathématiques : l’entrée décrit un problème qui nécessite un raisonnement mathématique à un certain niveau, qui peut être numérique, logique, géométrique ou autre.
Raisonnement ou pensée logique : le modèle doit faire une série de déductions logiques.
Extraction d'entités : L'extraction d'entités peut extraire des entités en fonction d'une question d'entrée fournie. Vous pouvez extraire des entités spécifiques du texte ou de la saisie en fonction de votre demande.
Chain-of-thought raisonnement : step-by-step expliquez comment une réponse est dérivée en fonction de votre invite.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Concepts d'ingénierie rapides

Routage rapide intelligent