Qu’est-ce que l’ingénierie de requête ? - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Qu’est-ce que l’ingénierie de requête ?

L'ingénierie rapide fait référence à la pratique consistant à créer et à optimiser des invites de saisie en sélectionnant les mots, les phrases, les signes de ponctuation et les caractères de séparation appropriés à utiliser efficacement LLMs pour une grande variété d'applications. En d'autres termes, l'ingénierie rapide est l'art de communiquer avec unLLM. Des instructions de haute qualité les conditionnent LLM pour générer les réponses souhaitées ou meilleures. Les instructions détaillées fournies dans ce document sont applicables à l'ensemble LLMs d'Amazon Bedrock.

L’approche d’ingénierie de requête la plus efficace pour votre cas d’utilisation dépend à la fois de la tâche et des données. Les tâches courantes prises en charge par Bedrock LLMs sur Amazon sont les suivantes :

  • Classification : l’invite inclut une question avec plusieurs choix de réponse possibles, et le modèle doit répondre avec le choix approprié. L’analyse du sentiment est un exemple de cas d’utilisation de la classification : l’entrée est un passage de texte, et le modèle doit classer le sentiment du texte (positif ou négatif, inoffensif ou toxique, par exemple).

  • Question-réponse, sans contexte : le modèle doit répondre à la question avec ses connaissances internes, sans contexte ni document.

  • Question-réponse, avec contexte : l’utilisateur fournit un texte d’entrée avec une question, et le modèle doit y répondre en fonction des informations fournies dans le texte d’entrée.

  • Résumé : l’invite est un passage de texte, et le modèle doit répondre par un passage plus court qui capture les points principaux de l’entrée.

  • Génération de texte ouvert : à l’envoi d’une invite, le modèle doit répondre par un passage de texte original correspondant à la description. Cela comprend également la génération de textes créatifs tels que des histoires, des poèmes ou des scénarios de films.

  • Génération de code : le modèle doit générer du code en fonction des spécifications de l’utilisateur. Par exemple, une invite peut demander la génération de code texte ou SQL Python.

  • Mathématiques : l’entrée décrit un problème qui nécessite un raisonnement mathématique à un certain niveau, qui peut être numérique, logique, géométrique ou autre.

  • Raisonnement ou pensée logique : le modèle doit faire une série de déductions logiques.

  • Extraction d'entités : L'extraction d'entités peut extraire des entités en fonction d'une question d'entrée fournie. Vous pouvez extraire des entités spécifiques du texte ou de la saisie en fonction de votre demande.

  • hain-of-thought Raisonnement C : step-by-step expliquez comment une réponse est dérivée en fonction de votre invite.