Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Opciones de IA generativa para consultar documentos personalizados
Las organizaciones suelen tener varias fuentes de datos estructurados y no estructurados. Esta guía se centra en cómo utilizar la IA generativa para responder preguntas a partir de datos no estructurados.
Los datos no estructurados de su organización pueden provenir de diversas fuentes. Pueden ser archivos de texto PDFs, wikis internas, documentos técnicos, sitios web públicos, bases de conocimiento u otros. Si desea un modelo básico que pueda responder a las preguntas sobre los datos no estructurados, tiene a su disposición las siguientes opciones:
-
Prepare un nuevo modelo básico utilizando sus documentos personalizados y otros datos de formación
-
Perfeccione un modelo básico existente utilizando los datos de sus documentos personalizados
-
Utilice el aprendizaje contextual para pasar un documento al modelo básico cuando haga una pregunta
-
Utilice un enfoque de recuperación y generación aumentada (RAG)
Formar un nuevo modelo básico desde cero que incluya sus datos personalizados es una tarea ambiciosa. Algunas empresas lo han hecho con éxito, como Bloomberg con sus BloombergGPT
El ajuste preciso de un modelo existente implica tomar un modelo, como un modelo Amazon Titan, Mistral o Llama, y luego adaptarlo a los datos personalizados. Existen varias técnicas de ajuste, la mayoría de las cuales implican modificar solo unos pocos parámetros en lugar de modificar todos los parámetros del modelo. Esto se denomina ajuste preciso con eficiencia de parámetros. Existen dos métodos principales para el ajuste fino:
-
El ajuste supervisado utiliza datos etiquetados y ayuda a entrenar el modelo para un nuevo tipo de tarea. Por ejemplo, si desea generar un informe basado en un formulario PDF, puede que tenga que enseñarle al modelo cómo hacerlo proporcionando suficientes ejemplos.
-
Los ajustes sin supervisión son independientes de las tareas y adaptan el modelo básico a sus propios datos. Entrena al modelo para que comprenda el contexto de los documentos. Luego, el modelo ajustado crea contenido, como un informe, mediante un estilo más personalizado para su organización.
Sin embargo, es posible que el ajuste fino no sea ideal para los casos de uso de preguntas y respuestas. Para obtener más información, consulte Comparación del RAG y el ajuste fino en esta guía.
Al hacer una pregunta, puede pasar a un documento el modelo básico y utilizar el aprendizaje contextual del modelo para obtener las respuestas del documento. Esta opción es adecuada para la consulta ad hoc de un solo documento. Sin embargo, esta solución no funciona bien para consultar varios documentos o para consultar sistemas y aplicaciones, como Microsoft SharePoint o Atlassian Confluence.
La última opción es usar RAG. Con RAG, el modelo básico hace referencia a sus documentos personalizados antes de generar una respuesta. RAG amplía las capacidades del modelo a la base de conocimientos interna de su organización, sin necesidad de volver a entrenar el modelo. Es un enfoque rentable para mejorar el resultado del modelo para que siga siendo relevante, preciso y útil en varios contextos.