Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.ugto.mx/handle/20.500.12059/7711
Título: | Aplicación de algoritmo K-NN para la detección de fugas en la red de agua potable del Sector Las Haciendas en Valle de Santiago, Gto. |
Autor: | JAIRO EDUARDO HERNÁNDEZ RAMÍREZ |
Contributor: | ELIZABETH PAULINE CARREÑO ALVARADO |
Contributor's IDs: | info:eu-repo/dai/mx/cvu/446585 |
Resumen: | La calidad del agua que se distribuye a través de los sistemas de distribución de agua, tiene el mayor impacto en la salud pública. Alterar cualquiera de las características organolépticas, físicas, químicas o microbiológicas incide directamente en el nivel de riesgo sanitario presente en el agua. En muchos países en desarrollo, el riesgo microbiológico es bastante marcado principalmente asociado al saneamiento. Esto se ratifica en la agenda 21 de la conferencia de Naciones Unidas afirmando que el 80% de todas las enfermedades y más de una tercera parte de las defunciones en estos países tienen por causa el consumo de agua contaminada (Lozada et Al. 2009). La detección de anomalías se ha convertido en una herramienta importante en diversos sectores: aplicaciones médicas, detección de fraudes, análisis de redes, procesamiento de imágenes, detección de intrusiones, entre otros. Una anomalía se define como una instancia de datos que contiene valores muy diferentes al resto del conjunto de datos utilizado (López et Al. 2019). Cabe resaltar que los modelos de detección de anomalías pueden ser clasificados acorde a la naturaleza de la entrada, tipo de anomalía, etiquetado de datos o tipo de salida. En muchas compañías que aplican la detección de anomalías la cantidad de datos almacenados supera las capacidades humanas para su procesamiento. Esto implica un gran reto para los algoritmos tradicionales y es necesario utilizar herramientas informáticas que permitan identificar de entre miles o millones de datos, los que son potencialmente fraudulentos o diferentes al resto. El aprendizaje de máquina ha demostrado que puede ser una gran herramienta. Es un enfoque basado en datos bien procesados que puede encontrar relaciones y patrones complejos, después de un proceso de aprendizaje supervisado. Puede identificar eventos anómalos de eventos normales, en estos casos se denominan soft sensors, donde se mezcla información de otras fuentes, para inferir en este caso un evento anómalo (Reynoso-Meza and Carreño-Alvarado, 2021). Es importante tener en cuenta que la detección de anomalías omite errores que ocurren dentro de los límites del comportamiento normal de un sistema. La detección de un comportamiento anómalo puede verse como un problema de clasificación. El algoritmo kNN (k-Nearest Neighbors), es un algoritmo de clasificación esencial en Machine Learning. Este clasificador es un algoritmo de aprendizaje no paramétrico, es decir, no hace suposiciones explicitas sobre la forma funcional de los datos y basado en distancias. En otras palabras, memoriza las distancias de formación para usarlas en la fase de predicción. Existen diferentes distancias que se pueden utilizar para determinar los vecinos más cercanos; por ejemplo: distancia euclidiana, distancia Manhattan, distancia Minkowski, entre otras. Las reglas de clasificación por vecindad están basadas en un conjunto de prototipos de los k prototipos más cercanos al patrón a clasificar, se le conoce como mecanismo de aprendizaje perezoso (Cambronero, C. G., & Moreno, I. G., 2006). |
Fecha de publicación: | dic-2022 |
Editorial: | Universidad de Guanajuato |
Licencia: | http://creativecommons.org/licenses/by-nc-nd/4.0 |
URI: | http://repositorio.ugto.mx/handle/20.500.12059/7711 |
Idioma: | spa |
Aparece en las colecciones: | Ingeniería Hidráulica |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
JAIRO EDUARDO HERNÁNDEZ RAMÍREZ_Tesis24.pdf | 1.67 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.