Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Options d'IA génératives pour interroger des documents personnalisés
Organisations disposent souvent de différentes sources de données structurées et non structurées. Ce guide explique comment utiliser l'IA générative pour répondre à des questions à partir de données non structurées.
Les données non structurées de votre organisation peuvent provenir de différentes sources. Il peut s'agir de fichiers texte PDFs, de wikis internes, de documents techniques, de sites Web destinés au public, de bases de connaissances ou autres. Si vous souhaitez un modèle de base capable de répondre aux questions relatives aux données non structurées, les options suivantes sont disponibles :
-
Formez un nouveau modèle de base en utilisant vos documents personnalisés et d'autres données de formation
-
Affinez un modèle de base existant en utilisant les données de vos documents personnalisés
-
Utilisez l'apprentissage contextuel pour transmettre un document au modèle de base lorsque vous posez une question
-
Utiliser une approche RAG (Retrieval Augmented Generation)
Former un nouveau modèle de base à partir de zéro qui inclut vos données personnalisées est une entreprise ambitieuse. Quelques entreprises l'ont fait avec succès, telles que Bloomberg avec leur BloombergGPT
Pour affiner un modèle existant, il faut prendre un modèle, tel qu'un modèle Amazon Titan, Mistral ou Llama, puis l'adapter à vos données personnalisées. Il existe différentes techniques de réglage précis, dont la plupart impliquent de ne modifier que quelques paramètres au lieu de modifier tous les paramètres du modèle. C'est ce qu'on appelle un réglage fin efficace en fonction des paramètres. Il existe deux méthodes principales pour affiner les réglages :
-
Le réglage fin supervisé utilise des données étiquetées et vous aide à entraîner le modèle pour un nouveau type de tâche. Par exemple, si vous souhaitez générer un rapport basé sur un formulaire PDF, vous devrez peut-être apprendre au modèle à le faire en fournissant suffisamment d'exemples.
-
Le réglage fin non supervisé est indépendant des tâches et adapte le modèle de base à vos propres données. Il entraîne le modèle pour qu'il comprenne le contexte de vos documents. Le modèle affiné crée ensuite du contenu, tel qu'un rapport, en utilisant un style plus personnalisé pour votre organisation.
Cependant, le réglage précis n'est peut-être pas idéal pour les cas d'utilisation sous forme de questions-réponses. Pour plus d'informations, consultez la section Comparaison entre RAG et optimisation dans ce guide.
Lorsque vous posez une question, vous pouvez transmettre à un document le modèle de base et utiliser l'apprentissage contextuel du modèle pour renvoyer les réponses du document. Cette option convient à l'interrogation ad hoc d'un seul document. Cependant, cette solution ne fonctionne pas bien pour interroger plusieurs documents ou pour interroger des systèmes et des applications, tels que Microsoft SharePoint ou Atlassian Confluence.
La dernière option consiste à utiliser RAG. Avec RAG, le modèle de base référence vos documents personnalisés avant de générer une réponse. RAG étend les capacités du modèle à la base de connaissances interne de votre organisation, le tout sans qu'il soit nécessaire de modifier le modèle. Il s'agit d'une approche rentable pour améliorer le résultat du modèle afin qu'il reste pertinent, précis et utile dans divers contextes.