Please use this identifier to cite or link to this item: http://repositorio.ugto.mx/handle/20.500.12059/13982
Full metadata record
DC FieldValueLanguage
dc.rights.licensehttp://creativecommons.org/licenses/by/4.0es_MX
dc.contributorAlmanza Ojeda, Dora Luzes_MX
dc.creatorGarcía Guzman, Robertoes_MX
dc.date.accessioned2026-02-18T16:18:23Z-
dc.date.available2026-02-18T16:18:23Z-
dc.date.issued2026-02-
dc.identifier.urihttp://repositorio.ugto.mx/handle/20.500.12059/13982-
dc.description.abstractEn este trabajo se presenta un asistente virtual, basado en LLMs de código abierto y técnicas de Recuperación-Generación Aumentada (RAG, Retreival-Augmented Generation), diseñado para responder preguntas sobre la normativa de la Universidad de Guanajuato utilizando como única fuente de información los documentos oficiales disponibles en formato PDF. El sistema alcanzó una puntuación BERT de 0.75 y un porcentaje de aciertos del 88 %. Una primera contribución de este trabajo es la implementación de un asistente capaz de ofrecer respuestas referenciadas, vinculando cada salida con los artículos y documentos correspondientes. La segunda contribución consiste en el desarrollo de una metodología de extracción de información a partir de documentos PDF, la cual aprovecha sus elementos visuales para recuperar la estructura jerárquica de la normativa. Esto facilita la separación en fragmentos y permite relacionar correctamente cada respuesta con los artículos correspondientes de los documentos oficiales. Para la recuperación de información y la generación de respuesta, se evaluaron distintos modelos de extracción de embeddings y de inferencia, seleccionando los más aptos considerando su desempeño y el hardware disponible: Qwen3-Embedding-8B-Q4 K M como extractor de embeddings y gpt-oss-20b-MXFP4 para la inferencia.es_MX
dc.formatapplication/pdfes_MX
dc.language.isospaes_MX
dc.publisherUniversidad de Guanajuatoes_MX
dc.rightsinfo:eu-repo/semantics/openAccesses_MX
dc.subject.classificationCIS- Maestría en Ingeniería Eléctrica (Instrumentación y Sistemas Digitales)es_MX
dc.titleDesarrollo de un asistente virtual por reentrenamiento de LLMs con recuperación-generación aumentada desde documentos normativoses_MX
dc.typeinfo:eu-repo/semantics/masterThesises_MX
dc.subject.keywordsLLMses_MX
dc.subject.keywordsModelo extenso de lenguajees_MX
dc.subject.keywordsInteligencia Artificiales_MX
dc.subject.keywordsAsistente virtuales_MX
dc.subject.keywordsChatbotes_MX
dc.subject.keywordsNormatividad institucionales_MX
dc.subject.keywordsDerecho a la informaciónes_MX
dc.contributor.roledirectores_MX
dc.type.versioninfo:eu-repo/semantics/publishedVersiones_MX
dc.contributor.oneAndrade Ambriz, Yair Alejandroes_MX
dc.contributor.roleonedirectores_MX
Appears in Collections:Maestría en Ingeniería Eléctrica (Instrumentación y Sistemas Digitales)

Files in This Item:
File Description SizeFormat 
205001205913982.pdf5.13 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.