As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Opções generativas de IA para consultar documentos personalizados
As organizações geralmente têm várias fontes de dados estruturados e não estruturados. Este guia se concentra em como você pode usar a IA generativa para responder perguntas de dados não estruturados.
Os dados não estruturados em sua organização podem vir de várias fontes. Podem ser arquivos de texto PDFs, wikis internos, documentos técnicos, sites públicos, bases de conhecimento ou outros. Se você quiser um modelo básico que possa responder perguntas sobre dados não estruturados, as seguintes opções estão disponíveis:
-
Treine um novo modelo básico usando seus documentos personalizados e outros dados de treinamento
-
Ajuste um modelo básico existente usando dados de seus documentos personalizados
-
Use o aprendizado contextual para passar um documento para o modelo básico ao fazer uma pergunta
-
Use uma abordagem de geração aumentada de recuperação (RAG)
Treinar do zero um novo modelo básico que inclua seus dados personalizados é uma tarefa ambiciosa. Algumas empresas fizeram isso com sucesso, como Bloomberg com seus BloombergGPT
O ajuste fino de um modelo existente envolve pegar um modelo, como Amazon Titan, Mistral ou Llama, e depois adaptar o modelo aos seus dados personalizados. Existem várias técnicas de ajuste fino, a maioria das quais envolve a modificação de apenas alguns parâmetros em vez de modificar todos os parâmetros do modelo. Isso é chamado de ajuste fino com eficiência de parâmetros. Há dois métodos principais de ajuste fino:
-
O ajuste fino supervisionado usa dados rotulados e ajuda você a treinar o modelo para um novo tipo de tarefa. Por exemplo, se você quiser gerar um relatório com base em um formulário PDF, talvez seja necessário ensinar ao modelo como fazer isso fornecendo exemplos suficientes.
-
O ajuste fino não supervisionado é independente da tarefa e adapta o modelo básico aos seus próprios dados. Ele treina o modelo para entender o contexto de seus documentos. Em seguida, o modelo ajustado cria conteúdo, como um relatório, usando um estilo mais personalizado para sua organização.
No entanto, o ajuste fino pode não ser ideal para casos de uso de perguntas e respostas. Para obter mais informações, consulte Comparação do RAG e ajuste fino neste guia.
Ao fazer uma pergunta, você pode transmitir a um documento o modelo básico e usar o aprendizado contextual do modelo para retornar as respostas do documento. Essa opção é adequada para consultas ad hoc de um único documento. No entanto, essa solução não funciona bem para consultar vários documentos ou para consultar sistemas e aplicativos, como o Microsoft SharePoint ou o Atlassian Confluence.
A opção final é usar o RAG. Com o RAG, o modelo básico faz referência aos seus documentos personalizados antes de gerar uma resposta. O RAG estende os recursos do modelo para a base de conhecimento interna da sua organização, tudo sem a necessidade de retreinar o modelo. É uma abordagem econômica para melhorar a saída do modelo para que ela permaneça relevante, precisa e útil em vários contextos.