Please use this identifier to cite or link to this item:
http://repositorio.ugto.mx/handle/20.500.12059/13982| Title: | Desarrollo de un asistente virtual por reentrenamiento de LLMs con recuperación-generación aumentada desde documentos normativos |
| Authors: | García Guzman, Roberto |
| Contributor: | Almanza Ojeda, Dora Luz |
| Abstract: | En este trabajo se presenta un asistente virtual, basado en LLMs de código abierto y técnicas de Recuperación-Generación Aumentada (RAG, Retreival-Augmented Generation), diseñado para responder preguntas sobre la normativa de la Universidad de Guanajuato utilizando como única fuente de información los documentos oficiales disponibles en formato PDF. El sistema alcanzó una puntuación BERT de 0.75 y un porcentaje de aciertos del 88 %. Una primera contribución de este trabajo es la implementación de un asistente capaz de ofrecer respuestas referenciadas, vinculando cada salida con los artículos y documentos correspondientes. La segunda contribución consiste en el desarrollo de una metodología de extracción de información a partir de documentos PDF, la cual aprovecha sus elementos visuales para recuperar la estructura jerárquica de la normativa. Esto facilita la separación en fragmentos y permite relacionar correctamente cada respuesta con los artículos correspondientes de los documentos oficiales. Para la recuperación de información y la generación de respuesta, se evaluaron distintos modelos de extracción de embeddings y de inferencia, seleccionando los más aptos considerando su desempeño y el hardware disponible: Qwen3-Embedding-8B-Q4 K M como extractor de embeddings y gpt-oss-20b-MXFP4 para la inferencia. |
| Issue Date: | Feb-2026 |
| Publisher: | Universidad de Guanajuato |
| License: | http://creativecommons.org/licenses/by/4.0 |
| URI: | http://repositorio.ugto.mx/handle/20.500.12059/13982 |
| Language: | spa |
| Appears in Collections: | Maestría en Ingeniería Eléctrica (Instrumentación y Sistemas Digitales) |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| 205001205913982.pdf | 5.13 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

