Evolutionary learning of selection Hyper-Heuristics for choosing the right method in Text Classification Problems

JONATHAN DE JESUS ESTRELLA RAMIREZ

Please use this identifier to cite or link to this item: http://repositorio.ugto.mx/handle/20.500.12059/9604

Title:	Evolutionary learning of selection Hyper-Heuristics for choosing the right method in Text Classification Problems
Authors:	JONATHAN DE JESUS ESTRELLA RAMIREZ
Authors' IDs:	info:eu-repo/dai/mx/cvu/806210
Contributor:	JUAN CARLOS GOMEZ CARRANZA
Contributor's IDs:	info:eu-repo/dai/mx/cvu/37720
Abstract:	La clasificación de textos es una tarea común en diferentes áreas de aprendizaje de máquina y tiene muchas aplicaciones. Dentro de esta tarea, existen diversos problemas tales como filtrado de correo electrónico, detección de noticias falsas, detección de sentimientos, etc. Diferentes conjuntos de datos pueden ser usados dependiendo del problema, pero el método de clasificación óptimo puede ser específico para cada uno. Sin embargo, el proceso para encontrar este método óptimo es un problema complicado. En el ámbito de aprendizaje de máquina automatizado, diferentes enfoques han sido desarrollados para atacar este problema; los más recientes basados en aprendizaje profundo. En este proyecto de tesis, un modelo evolutivo, con el objetivo de generalizar la selección de métodos en problemas de clasificación de textos mediante hiper-heurísticas de selección, es presentado. Dado un conjunto de datos, este es caracterizado mediante un grupo de 16 meta-características estadísticas que representan su distribución de datos. Una hiper-heurística consta de un conjunto de reglas de la forma si-entonces, donde cada regla evalúa el grupo de meta-características para así determinar el método de clasificación adecuado para tal conjunto de datos. El modelo evolutivo parte de la creación de una población inicial de hiper-heurísticas, que con el paso de las generaciones, es evolucionada mediante operadores de cruza y mutación específicos. Durante cada generación, el desempeño de las hiper-heurísticas es evaluado mediante un grupo de conjuntos de datos de entrenamiento. En la última generación, la hiper-heurística con el mejor desempeño es seleccionada, y su generalización final es determinada con un grupo de conjuntos de datos independiente. Los resultados y análisis indican que la mejor hiper-heurística aprendida, además de contar con una buena generalización, es más eficiente que dos sistemas de aprendizaje de máquina automatizados del estado del arte, con desempeños generales muy similares.
Issue Date:	Sep-2023
Publisher:	Universidad de Guanajuato
License:	http://creativecommons.org/licenses/by-nc-nd/4.0
URI:	http://repositorio.ugto.mx/handle/20.500.12059/9604
Language:	eng
Appears in Collections:	Maestría en Ingeniería Eléctrica (Instrumentación y Sistemas Digitales)

Files in This Item:

File	Description	Size	Format
JONATHÁN DE JESÚS ESTRELLA RAMÍREZ_Tesis24.pdf		6.95 MB	Adobe PDF	View/Open

Show full item record